علم آمار به معنای مطالعه فرآیند گردآوری، تجزیه و تحلیل، تفسیر، ارائه و سازماندهی دادههای خام است. با توجه به این موضوع، تعریف تحلیل آماری (statistical analysis) به معنای تولید نمودارها و جداول آماری از دادههای خام است، به گونه ای که نتایج آن قابل فهم و استنتاج باشند. فرض کنید به عنوان یک پژوهشگر اقدام به توزیع پرسشنامه در مورد یک موضوع مشخص کردهاید و دادههای خام بسیاری را در این حوزه جمع نمودهاید. اما چطور میخواهید متوجه نظر مشارکت کنندگان و یا افراد پاسخ دهنده به تحقیق شوید؟ چگونه میخواهید دریابید که نتایج تحقیق چه بودهاست؟ و یا چطور میخواهید از صحت و اعتبار تحقیقتان مطمئن شوید؟
در همین راستا یکی از اساسیترین و مهمترین ابزار تحلیل و بررسی صحت و دقت نتایج تحقیق، استفاده از تحلیل آماری (Statistical Analysis) است که به شما کمک می کند تا یافتهها و نتایج شفافی از دادههای خام بدست آورید. شروع فرآیند تحلیل آماری با مشخص کردن جامعه آماری و جامعه نمونه آغاز میشود.
پیش از آنکه اقدام به جمعآوری دادهها کنید باید سعی کنید جامعه هدف خود برای تحقیق را شناسایی نمایید. برای مثال فرض کنید موضوع تحقیق شما " تاثیر تحریمهای بینالمللی بر روی تصمیمهای سازمانی هتلداران کشور" است. به نظر شما جامعه هدف مناسب برای گردآوری دادههای آماری کدام است؟ آیا کارکنان هتلها هم میتوانند در فرآیند گردآوری دادهها مشارکت کنند؟ آیا تنها مدیران و تصمیمگیران هتلها گزینه مناسبی هستند و یا سیاستگذاران کشوری در حوزه گردشگری و هتلداری نیز مناسب این تحقیق میباشند؟ انتخاب درست و دقیق جامعه آماری به شما کمک میکند که بتوانید دادههای دقیقتری داشته و به نتایج کاربردیتر دست پیدا کنید.
جامعه نمونه نماد و مظهری از جامعه آماری است و یک ماهیت خلاصه شده از آن ارائه مینماید. در مثال قبلی گردآوری داده از تمامی مدیران و سیاستگذاران هتلداری کار بسیار دشواری است و به همین منظور پژوهشگر سعی میکند یک جامعه نمونه از آن انتخاب کند. برای مثال جامعه هتلداران استان تهران و یا مدیران هتل های 4و5 ستاره میتوانند نمونه مناسب و قابل اندازهگیری برای یک تحقیق باشند. از طرف دیگر انتخاب نمونه در تعمیمپذیری تحقیق تاثیر بسیار زیادی دارد. اگر نمونه آماری به درستی انتخاب شود و نماینده مناسبی برای کل جامعه باشد، در نهایت نتایج به دست آمده از نمونه تحقیق قابل تعمیم به کل جامعه آماری است.
تحلیلهای آماری و کمی که در حوزههای مختلف انجام میگیرند دو رویکرد کلی را دنبال میکنند:
(1) مطالعات آزمایشگاهی
(2) مطالعات مشاهدهای
مطالعات آزمایشگاهی (Experimental Study) برروی یک سیستم و یا نمونه انجام میشود و هدف آن دستکاری و بررسی نتایج حاصل از دستکاری است. فرض کنید قصد بررسی مقاومت یک نوع خاصی از سیمان یا بتون در محیط آزمایشگاه را دارید.
در این حالت سعی میکنید با اعمال تغییرات و دستکاری محیطی مانند رطوبت، فشار، دما و سایر عوامل محیطی و شیمیایی، میزان مقاومت در سیمان و یا بتون را اندازه بگیرید.
مطالعات مشاهده ای (Observational Study) که بیشتر در حوزه علوم اجتماعی مورد استفاده قرار میگیرند به بررسی یه موضوع در جامعه پرداخته و نتایج حاصل از مشاهدات خود را گزارش خواهد کرد.
دو روش آماری مهم در فرآیند تحلیل آماری نیز عبارتند از:
(1) آماری توصیفی (Descriptive Statistic)
آمار توصیفی در تحلیل آماری به بررسی و تجزیه و تحلیل یک گروه مشخص و یا نمونه خاص پرداخته که تنها ویژگیهای آن گزارش میشود و این نتایج قابل تعمیم نمی باشد.
(2) آمار استنباطی (Inferential Statistic)
آمار استنباطی به مطالعه نمونه به عنوان نمایندهای از کل جامعه پرداخته و نتایج آن را به صورت یافتههای قابل تعمیم ارائه مینماید.
اولین نوشتهها و مستندات در مورد تحلیل آماری و احتمالات توسط خلیل ابن احمد فراهیدی دانشمند عرب بین قرن 100-176 هجری در کتاب "پیامهای رمزنگاری" مورد استفاده قرار گرفت. در این کتاب خلیل ابن احمد از روشها و تحلیلهای آماری و ریاضی سخن گفت که به واسطه آن میتوان پیامها را رمز نگاری و کدگذاری کرد.
اما اولین نوشتهها در مورد آمار و تحلیل آماری در اروپا به سال 1663 باز میگردد. در این سال مقالهای با عنوان "مشاهدات طبیعی و سیاسی در مورد لوایح مرگ و میر" توسط شخصی به نام جان گرانت (John Graunt) منتشر شد. این تحقیق به ضرورت استفاده از داده ها و تحلیلهای آماری در سیاست گذاری و تصمیمسازی اقتصادی و سیاسی پرداختهبود و به این موضوع اشاره داشت که اطلاعات زمینهای و جمعیت شناختی در یک جامعه میتوانند در فرآیند برنامهسازی اقتصادی و سیاسی تاثیر بسزایی داشته باشند.
اما شکل جدید و شناخته شده امروزی علم آمار در اوایل قرن 19و20 در سه مرحله شکل گرفت. اولین مرحله از فرآیند شکلگیری تحلیل و علوم آماری توسط فرانسیس گالتون و کارل پیرسون (Galton and Pearson) شکل گرفت که روشهای آماری را به قواعد بسیار منظم و کاربردی برای تحلیل تبدیل کردند. از مهمترین دستاوردهای گالتون ارائه تعاریف آماری مانند انحراف معیار، رگرسیون و همبستگی بود که تاثیر بسیار زیادی در درک روابط بین متغیرهای آماری ایجاد کرد.
دومین موج از توسعه علم آمار و تحلیل آماری بین سالهای 1910 تا 1920 شکل گرفت که مهمترین نقش در توسعه آن را شخصی به نام ویلیام سیلی (William Sealy) ایفا کرد و رونالد فیشر (Ronald Fisher) آن را به اوج رسانید. رونالد فیشر در یکی از مهمترین و معتبرترین مقالاتش، مفهومی به نام واریانس و اهمیت آن در تحلیلهای آماری را مطرح کرد و در نهایت آخرین موج از توسعه علم آمار که به اصلاح و تعدیل مفاهیم قبلی اختصاص داشت توسط پیرسون و نیمن (Pearson and Neyman) بین سال های 1930-1934 انجام گرفت.
امروزه علم آمار و تحلیلهای آماری در بسیاری از تحقیقات، برنامهریزیها و تصمیمگیریهای کشوری و بین الملل نقش اساسی داشته و به واسطه آن میتوان به نتایجی بسیار دقیق دست یافت و استدلالهایی مبتنی بر واقعیت انجام داد. با توجه به اینکه روشها و تکنیکهای مختلفی برای تجزیه و تحلیل آماری و فهم دادههای خام وجود دارد، اما تحلیلهای آماری معمولا بر3 مفهوم کلی استوار هستند که درک آنها کمک بسیار زیادی به پژوهشگران در تجزیه و تحلیل دادههای خام خواهد کرد. به پژوهشگران توصیه میشود قبل از انجام تحلیلهای پیشرفته توسط نرم افزارهای آماری، 3 مفهوم بنیادی در آمار را آموخته و مورد استفاده قرار دهند.
این 3 مفهوم بنیادی در تحلیل آماری عبارتند از:
میانگین: میانگین که در زبان آماری با دو عنوان (Mean) و (Average) شناخته میشود، نشان دهنده روند کلی در دادههای خام است. میانگین کاربردهای بسیار زیادی در تحلیل ایفا میکند برای مثال قصد دارید بدانید میانگین پاسخهای افراد در یک طیف لیکرت 5 تایی چگونه است؟ آیا دادهها می تواند نرمال باشد یا غیرنرمال هستند؟ و یا میانگین عددی یک متغیر چگونه است.
برای مثال فرض کنید میزان تحمل فشار در بیش از 1000 لوله چدنی با اندازه، شکل و وزن یکسان در نرم افزار SPSS وارد شده است و هر کدام از این قطعههای آلیاژی در یک فشار مشخص و متفاوت با سایرین شکسته میشود. حال میخواهید متوجه شوید که میانگین فشاری که این 1000 لوله چدنی تحمل کردهاند چه مقدار است؟ بهترین روش برای این کار استفاده از میانگین یا دستور Mean در نرم افزارهای آماری است. اما تنها استفاده از میانگین در تفسیر آمار نمیتواند روش تحلیل مناسبی باشد چرا که این مفهوم با میانه (Median) و مد (Mode) ارتباط نزدیکی دارد و در دادههای با توزیع غیر نرمال اهمیت پیدا میکنند.
انحراف معیار: دومین مفهوم بنیادی در آمار انحراف معیار یا Standard Deviation نام دارد که پراکندگی دادهها در اطراف میانگین را اندازه میگیرد. انحراف معیار بالا نشاندهنده این است که داده از میانگین فاصله زیادی دارند و انحراف معیار پایین نشاندهنده این است که پراکندگیدادهها بسیار نزدیک و در اطراف میانگین است. یکی از بهترین و مناسبترین ابزارها برای تشخیص پراکندگی دادهها انحراف معیار است، اما اگر پراکندگی داده غیرنرمال و با الگوی پیچیده باشند نمیتوان از ابزار انحراف معیار برای تفسیر بهره برد.
رگرسیون: رگرسیون (Regression) یکی از ابزارهای آماری برای سنجش ارتباط میان متغیرهای وابسته و پیوسته است. ابزار رگرسیون میتواند یک پیشبینی از رفتار و تغییرات یک متغیر نسبت به متغیر دیگر را ارائه نماید. بطور کلی خط رگرسیون که از میان نقاط پراکندگی متغیر عبور میکند میتواند نشان دهد که ارتباطات تا چه اندازهای قوی یا ضعیف هستند.
آزمونهای آماری - اصطلاح شناسی مقالات