اگر ناهمگنی پارامترها میان افراد و مقاطع یا در طول سری زمانی را نادیده بگیریم میتواند به برآوردهای ناسازگار یا بیمعنی از پارامترها منجر شود. پارامتر ممکن است برای افراد و مقاطع مختلف متفاوت باشد، اگرچه در طول زمان ثابت بماند. اگر این فرض اتخاذ شود، ممکن است انواع توزیعهای نمونهگیری رخ دهد. این توزیعهای نمونهگیری میتواند تا حد زیادی رگرسیون حداقل مربعات روی را با استفاده از NT مشاهده گمراهکننده کند. برای رفع مشکل واریانس ناهمسانی یا بهبود برآوردها از آزمون White cross-section استفاده میکنیم.
قدرت جذاب پانل دیتا ناشی از توانایی نظری آن در جداسازی اثرات، اقدامات و رفتار خاص فردی یا سیاستهای عامتر است. این توانایی نظری بر این فرض استوار است که دادههای اقتصادی از یک آزمایش کنترلشده به دست میآید که در آن رخدادها، متغیرهایی تصادفی با توزیع احتمال است. این رخدادها تابعی هموار از متغیرهای مختلف است که شرایط آزمایش را توصیف میکند. اگر دادههای موجود حقیقتا از آزمایشهای ساده کنترل شده بهدست آید، میتوان از روشهای استاندارد آماری استفاده کرد.
۳-۹-۳- آزمون معنی دار بودن مدل مربوط به فرضیهها
۱- آماره F
جهت بررسی معنیدار بودن مدلهای رگرسیون استفاده شده در تحقیق، آزمون تمامی ضرایب آنها که دلالت بر معنیدار بودن روابط بین متغیرهای مستقل و متغیر وابسته است از آماره F استفاده شده است. با مقایسه آماره F که طبق فرمول زیر بدست می آید و F جدول که با درجات آزادی K-1 و n-K در سطح خطای ۵% محاسبه شده، مدل فرضیه مورد بررسی قرار گرفته است.
(۳-۱۲)
از آنجاییکه در این تحقیق برای آزمون آماری، فرضیه به عنوان فرض جایگزین () در نظر گرفته شده است، زمانی فرضیه تایید میشود که F محاسبه شده (طبق محاسبات نرمافزار Eviews) از F جدول بزرگتر باشد.
۲- آزمون خود همبستگی
خود همبستگی زمانی رخ میدهد که خطاها با هم رابطه داشته باشند. به بیان دیگر جزء اخلال مربوط به یک مشاهده تحت تاثیر جزء اخلال یک مشاهده دیگر قرار دارد. اغلب در دادههای مقطعی انتظار میرود که متغیر مستقل یک مشاهده فقط بر متغیر وابسته همان مشاهده تاثیر گذارد و با مشاهدات دیگر ارتباطی نداشته باشد. (بیدرام، ۱۳۸۱)
برای تشخیص خودهمبستگی از آماره دوربین – واتسون استفاده میشود که طبق فرمول زیر محاسبه میگردد:
(۳-۱۳) = ۲ (۱– p)
جمله خطا در زمان t،
: جمله خطا در زمان t-1 است.
چنانچه این آماره با توجه به سطح اطمینان ۹۵%، نزدیک به عدد ۲ باشد، خود همبستگی وجود ندارد. (همان)
لازم به ذکر است که در این تحقیق از دادهها به صورت ترکیبی سری زمانی و مقطعی (panal) استفاده شده است. همچنین در استفاده از نرمافزار Eviews از تبیین GLS برای تصحیح ناهمسانی واریانس، و از متغیرهای خودرگرسیو[۱۱۶] AR (P) جهت برطرف کردن مشکل خود همبستگی استفاده شده است.
۳-۹-۴- آزمون فرضیهها
۱- ضریب همبستگی
ضریب همبستگی با توجه به نوع نمودار رگرسیون و نوع نمودار پراکنش دارای حالات مختلفی است و همواره بین ۱ و ۱- تعریف میشود و هر چه قدر مطلق ضریب همبستگی به عدد ۱ نزدیکتر باشد میتوان گفت اختلاف مقادیر پیشبینی شده با مقادیر واقعی کمتر خواهد بود، یعنی معادله رگرسیون از خطای کمتر و اعتبار بیشتری برخوردار است. ضریب همبستگی به صورت زیر محاسبه میشود:
(۳-۱۴)
۲- ضریب تشخیص یا تبیین
شاخصی است که نشاندهنده اعتبار معادله رگرسیون است. بهعبارت دیگر این شاخص درصد تغییرات متغیر وابسته را توسط متغیرهای مستقل نشان میدهد. یعنی مقدار آن، بیانگر درصد انطباق مقادیر پیشبینی شده با مقادیر واقعی خواهد بود. ضریب تشخیص عبارت است از
ملاک انتخاب متغیر مستقل مناسب ضریب تشخیص است. چنانچه بخواهیم از بین متغیرهای مستقل مختلف، بهترین آنها را انتخاب کنیم، ملاک را بر بزرگترین ضریب تشخیص خواهیم گذاشت. اگر بهترین متغیر مستقل انتخاب شده از سطح قابل قبول ضریب تشخیص برخوردار نباشد، به معنی آن است که تعمیم روند گذشته و پیشبینی y بر اساس یک متغیر مستقل امکانپذیر نیست. بلکه باید ترکیبی از متغیرهای مستقل (حداقل ۲ متغیر) را پیدا نمود تا ضریب تشخیص را به حد قابل قبول رساند. در این حالت از معادله رگرسیون چندگانه استفاده میشود.
در مدل رگرسیون چندگانه بهجای ضریب همبستگی معمولی از ضریب همبستگی چندگانه استفاده میشود. این ضریب نشان میدهد که شدت رابطه متغیرهای مستقل بهطور کلی با متغیر وابسته به چه میزان است. اگر ضریب همبستگی چندگانه را به توان ۲ برسانیم، ضریب تعیین بهدست میآید که معرف میزان تغییرپذیری (انحراف) در متغیر وابسته (y) است که به وسیله معادله رگرسیون توضیح داده میشود.
سومین مقداری که توسط نرمافزار EViews محاسبه میشود، ضریب تعیین تعدیل شده میباشد که فرمول آن به صورت زیر است:
(۳-۱۵)
در واقع این عامل باعث میشود که اریبی که در ضریب تعیین ناشی از حجم نمونه (n) است برطرف شود. تفاوت این ضریب با ضریب تعیین در عامل (n-2)/(n-1) میباشد. چنانچه مقدار n بزرگ
دانلود کامل پایان نامه در سایت pifo.ir موجود است. |
باشد مقدار (n-1)/(n-2) به یک نزدیک شده و تفاوت و به صفر میرسد.
عامل دیگری که به وسیله نرمافزار محاسبه میگردد خطای معیار است که میزان پراکندگی دادهها را حول رگرسیون برآوردی نشان میدهد. در این تحقیق با توجه به نوع دادهها و روشهای تجزیه و تحلیل آماری موجود، از روش دادههای ترکیبی استفاده شده است. زیرا بهمنظور بررسی تاثیر تدوین و اجرای استانداردهای ملی بر کیفیت اطلاعات متغیرهای مستقل و وابسته از دو جنبه متفاوت مورد بررسی قرار میگیرند؛ از یکسو، این متغیرها در میان شرکتهای مختلف و از سوی دیگر، در دوره زمانی ۱۳۸۷ تا ۱۳۹۲ آزمون میشوند.
۳- آزمون معنیدار بودن متغیر مستقل
برای بررسی معنیدار بودن ضرایب متغیرهای مستقل در هر مدل از آماره t استفاده شده است. برای محاسبه این آماره از فرمول زیر استفاده میشود.
(۳-۱۵)
(۳-۱۶)
: ضریب تخمینی؛
: انحراف معیار ضریب تخمینی؛
: مجذور اختلاف بین مشاهدات واقعی و برآوردی؛
n : مقدار مشاهدات؛
k : تعداد پارامترها.