تحلیل آماری به معنای گردآوری، طبقه بندی، آنالیز و تجزیه داده های خام جمع آوری شده از جامعه هدف به منظور دستیابی به نتایج و نظرات نهفته در تحقیق است. این نتایج برای تصمیم گیری های مدیریتی و برنامه ریزی های کوتاه، میان و بلند مدت اهمیت بسیار بالایی دارند. گزارشات حاصل از تحلیل های آماری می بایست در قالب نمودار، جدول و یا گراف در اختیار تصمیم گیران قرار بگیرند که به همراه تفسیرها و استدلالهای حاصل از خروجی های نرم افزار کاربرد پیدا می کنند. لازم به ذکر است داده های خام آماری ممکن است گزارشات سازمانی، یافته های آزمایشگاهی و یا نتایج حاصل از گردآوری پرسشنامه باشند. تمامی این داده ها به روش های متفاوت و با نرم افزارهای مختلف آماری تحلیل شده و یافته های آن تفسیر می شوند. به طور کلی فرآیند تحلیل آماری در سه مرحله کلی انجام و پیاده می شود:
گردآوری و مرتب سازی داده ها: اولین و مهمترین فرآیند مربوط به مهارت تحلیل آماری، نحوه گردآوری و مرتب سازی داده ها است. هر پژوهشگری باید تسلط کافی به ابزارهای گردآوری داده ها و شناسایی جامعه آماری و روش نمونه گیری داشته باشد. هر تحقیقی بسته به اهداف و موضوع آن باید روش و ابزار مشخصی را برای گردآوری داده ها استفاده کند. از جمله این روش ها می توان به مطالعات کتابخانه ای، بررسی اسناد، مصاحبه، پرسشنامه و غیره اشاره کرد. پس از مشخص کردن ابزار گردآوری داده ها نوبت به شناسایی جامعه آماری و تعیین نمونه می رسد که نقش بسیار مهمی در نتایج و یافته های تحقیق دارد.
انتخاب نمونه تحقیق باید به گونه ای باشد که نماینده مناسبی از جامعه آماری محسوب شده و پوشش دهنده نظرات جامعه آماری باشد. برای مثال فرض کنید جامعه آماری تحقیق شما در برگیرنده طیف سنی 18-65 سال است و شما باید یک نمونه آماری از آن انتخاب کنید. آیا می توانید فقط از افراد بین 18-30 سال تحقیق کنید؟ جواب این سوال خیر است چرا که نمونه شما پوشش دهنده جامعه آماری نیست. در نهایت پس از مشخص کردن این موارد و طی شدن فرآیند گردآوری داده ها نوبت به مرتب سازی آنها می رسد که می بایست داده های اشتباه، پرسشنامه های ناقص، اطلاعات نامربوط به تحقیق و سایر عوامل بی ارتباط به تحقیق از مجموعه داده های اولیه و خام حذف شوند تا فرآیند تحلیل آماری به درستی و دقت انجام پذیرد.
ورود به نرم افزار و کد گذاری داده ها: دومین مرحله از مهارت تحلیل آماری مربوط به طریقه کارکردن با نرم افزارهای آماری و وارد کردن داده های خام برای انجام آنالیزهای مربوط به آن است. تمامی تحلیل های آماری نیازمند استفاده از نرم افزارهای خاصی برای پیاده سازی آنالیزهای مربوطه هستند. از جمله این نرم افزارهای آماری می توان به SPSS, Smart PLS, R, Liserel, Eviews و غیره اشاره کرد. برای وارد کردن یا کد گذاری داده های خام روش های مشخصی وجود دارد که در ابتدا باید متغیرها را در نرم افزار تعریف کنید و در مرحله بعد این متغیرها را در قالب مفاهیم عددی تبیین نمایید. این کار برای تجزیه تحلیل آماری و درک نظرات بسیار ضروری است چرا که این نظرات معمولا در قالب طیف لیکرت یا سایر مقیاس های عددی طراحی می شوند.
تحلیل و تفسیر داده ها: آخرین مرحله از فرآیند تحلیل آماری مربوط به انجام آنالیز، گرفتن خروجی، ارائه خروجی های نرم افزار در قالب جدول، گراف و نمودار و در نهایت تفسیر و نتیجه گیری از خروجی های بدست آمده است. این فرآیند معمولا به دانش بسیار بالایی از علم آمار و مفاهیم آماری نیاز دارد. برای مثال اهمیت آلفای کرونباخ، مقیاس KMO یا تحلیل عاملی (factor loading) در برازش داده ها و شناسایی فاکتورهای تاثیرگذار در تحقیق چیست؟ یا اینکه چطور باید تشخیص بدهیم که از آزمونهای پارامتریک استفاده کنیم و یا آزمون های ناپارامتریک؟. پس از روش شناسی و نحوه استفاده از آزمون های آماری نوبت به سختترین مرحله یعنی تفسیر مفاهیم آماری میرسد که در این مرحله باید به زبانی کاملا ساده و شفاف تشریح کنید که یافته های تحقیق شما چه چیزهایی هستند و خروجی های نرم افزار چه معنایی می دهند.
همانطور که پیشتر بیان کردیم، مهارت های کاربردی تحلیل آماری نه تنها برای اهداف آکادمیک بلکه در دنیای رقابتی امروز برای کسب و کارهای مختلف نیز به یک ضرورت تبدیل شده اند. بر اساس تحقیق انجام گرفته توسط دانشگاه Northeastern در سال 2020 مشخص شد که بیش از 70 درصد از مدیران کسب و کارهای خدماتی در آمریکا ترجیح می دهند افرادی را استخدام کنند که تسلط بالایی به نرم افزارهای آماری و علم آمار داشته باشند. در حال حاضر بسیاری از دانشگاه ها در سراسر جهان تمرکز خودشان را بر روی آموزش تحلیل های آماری به دانشجویان گذاشته اند تا از این طریق بتوانند به آنها کمک کنند تا هر چه سریعتر جذب بازار کار شوند. از جمله مهارت عمده که در فرآیند تحلیل آماری آموزش داده می شود عبارتند از:
زبان پرسمان یا اس کیو ال (SQL)
ماکروسافت اکسل (Microsoft Excel)
تفکر انتقادی (Critical thinking)
نرم افزارهای آماری (Statistical Programs)
تصویر سازی داده (Data Visualization)
مهارت ارائه (Presentation Skill)
یادگیری ماشین یا داده کاوی (Machine Learning)
زبان اس کیو ال (SQL): یک زبان رایج مربوط به پایگاه داده استاندارد صنعتی است و شاید یکی از مهمترین مهارت های تحلیل آماری در نظر گرفته می شود. بسیاری از محققان باور دارند که زبان اس کیو ال (SQL) نمونه پیشرفته تر نرم افزار اکسل است که می تواند طیف وسیعی از داده های آماری را سازماندهی کند که نرم افزار اکسل براحتی قادر به انجام آن نخواهد بود.
بسیاری از کسب و کارها نیاز به شخصی دارند که تسلط بالایی به زبان اس کیو ال (SQL) برای مدیریت و ذخیره داده ها از پایگاه داده های چندگانه (Multiple Database) داشته باشد. بر اساس تعریف موسسه استاندارد ملی آمریکا، زبان اس کیو ال (SQL) یک سیستم مدیریت ارتباط دیتابیس است که با اهداف مختلف از جمله بروزرسانی داده ها در چندین دیتابیس و یا بازیابی آنها مورد استفاده قرار می گیرد. بر اساس تحقیقات انجام گرفته میانگین دستمزدی که کارفرمایان آمریکای حاضرند برای کارکنان مسلط به SQL بپردازند چیزی در حدود 75000 دلار است.
ماکروسافت اکسل (Microsoft Excel): شاید اولین چیزی که بعد از شنیدن نام نرم افزار اکسل به ذهنتان برسد یک صفحه خالی سفید رنگ جدول بندی شده است. اما مهارت های تحلیل آماری بسیار زیادی را می توان در قالب همین جداول یاد گرفته و طراحی نمود. اگرچه زبان برنامه نویسی R یا Python برای تحلیل و مدیریت داده های با اندازه بسیار بزرگ مناسب هستند ولی نرم افزار اکسل مناسب انجام آنالیزهای سریع و با حجم کم تا متوسط بسیار مناسب است. اگر در مراحل آغازین یادگیری مهارت آماری هستید و یا در یک شرکت تازه تاسیس کار میکنید ممکن است دیتا بیس شما در قالب یک فایل اکسل طراحی شده باشد.
تفکر انتقادی (Critical thinking): تفکر انتقادی بدین معناست که شما با دید پرسشگرانه به پدیده های اجتماعی و طبیعی اطراف خودتان نگاه کنید. دید انتقادی قوی موجب مطرح کردن سوالات درست و در نهایت پیاده سازی تحلیل های دقیق خواهد شد. برای موفقیت در مهارت تحلیل آماری نیاز است که همچون یک منتقد به پدیده ها و اتفاقات محیط اطراف نگاه کنید و جنبه مختلف آن را مورد بررسی قرار دهید. اگر چه ممکن است این مهارت کاربردی تا حدی عجیب و خارج از دسترس به نظر برسد اما چند روش مختلف برای بهبود آن وجود دارد. اولین روش این است که سعی کنید سوالاتی کاملا ساده در مورد پدیده ها و اتفاقات مطرح کنید بجای اینکه به دنبال راه حل بگردید.
مطرح کردن سوال موجب جهت دهی به تفکر شما می شود و شما را به سمت تحلیل و بررسی سوق می دهد اما مطرح کردن راه حل در همان مرحله اول موجب قضاوت سریع و انحراف شما از واقعیت موجود می شود. دومین روش بر روی میزان تمرکز شما بر رو موضوع تاکید دارد. هر چه تمرکز و دقت خودتان را بر روی یک موضوع بیشتر کنید موجب درگیری ذهنی و طرح سوالات مختلف در مورد آن موضوع خواهد شد.
نرم افزارهای آماری (Statistical Programs): یادگیری نرم افزارهای آماری یکی از ضرورت های مهارت تحلیل آماری است. شما به عنوان یک محقق هرچقدر هم که به دانش و علوم آماری تسلط داشته باشید باز هم بدون استفاده از نرم افزار آماری نمی توانید پژوهش خودتان را به نتیجه برسانید. فرض کنید کنید که شما برای تحلیل های AHP و TOPSIS از نرم افزار اکسل استفاده می کنید، اما اگر همین فرآیند را بخواهید روی کاغذ و به صورت دستی انجام دهید ممکن است هفته ها وقت شما را بگیرد. حال تصور کنید که پلتفرم هایی مانند R یا Python نیز ده ها برابر سریعتر از اکسل اقدام به تجزیه و تحلیل و آنالیز داده ها میکنند.
برای اینکه بتوانید به یک آنالیزور یا تحلیلگر حرفه ای تبدیل شوید باید بتوانید با نرم افزارهایی مانند SQL, R و Python به راحتی کار کنید چرا که خروجی های آماری را در زمانی بسیار کمتر و با دقتی بسیار بالا در اختیار تصمیمگیران سازمانی قرار می دهند. در میان نرم افزارهایی تحلیل آماری، پلتفرم های دیگری مانند SAS, SPSS, Smart PLS, Eviews و Liserel هم وجود دارند که میتوان بسته به اهداف تحقیق و یا میزان راحتی در یادگیری یکی از آنها را برای تحلیل آماری انتخاب نمود.
تصویر سازی داده (Data Visualization): همواره به محققان توصیه می شود که در ابتدای انجام تحقیق سعی کنید یک تصویر کلی از فرآیندهای موردنظرتان در ذهن مجسم کنید. این کار به شما کمک می کند که بتوانید مرحله به مرحله و به صورت سازمان یافته قادام به جمع آوری و تحلیل داده کنید و در نهایت نتایج مورد انتظار را بدست آورید. مهارت تصویر سازی به شما کمک می کند که علاوه بر سازماندهی فرآیند بتوانید استدلال های منطقی و دقیقی در مورد یافته های تحقیق داشته باشید. سعی کنید مهارت تصویر سازی را مبتنی بر واقعیت و خروجی های موجود انجام دهید و از محدوده تحقیق خارج نشوید.
مهارت ارائه (Presentation Skill): یادگیری مهارت ارائه یکی از دشوارترین و در عین حال زمانبر ترین مهارت است که به تمرین زیادی نیاز دارد. علاوه بر توانمندی های ذاتی برای یادگیری این مهارت باید بتوانید نیازهای مخاطبان را نیز به درستی شناسایی کنید. مهارت ارائه هم در قالب نوشتاری و هم در قالب سخنرانی نیاز به تسلط بالایی دارد. شما باید بتوانید در عین ارائه مطالب به زبان ساده، مفاهیم علمی را نیز منتقل کنید. سعی کنید بجای تمرکز بر روی خودتان و نحوه ارائه تان بر روی مخاطبان تمرکز کنید تا فکرتان از استرس و اشتباهات احتمالی دور شود.
یادگیری ماشین یا داده کاوی (Machine Learning): هوش مصنوعی (Artificial Intelligence) و تحلیل پیش بینانه (Predictive Analytics) دو مورد از جدیدترین و داغ ترین مباحثی هستند که در سالهای اخیر توجه بسیاری از متخصصان و کارفرمایان را به خود جلب کرده اند. اگر چه بسیاری از آنالیزورها و تحلیلگران حرفه ای آشنایی کمی با این دو مهارت دارند اما برای بهترین بودن در زمینه تحلیل های آماری بهتر است تا حدی در این رشته های جدید دانش بدست بیاورید. شاید بتوانید برای شروع کار از نرم افزارهای داده کاوی (Data Mining) مانند Orange نیز در این زمینه استفاده کنید.
نمونه تحقیق - مقاله علمی پژوهشی - نگارش ادبیات موضوع در پایان نامه