متا آنالیز چیست؟.
دادههای ترکیبشده از متاآنالیز ها معمولاً سودمندتر از نتایج ریویوهای روایی هستند. در یک متاآنالیز، تصمیمات شفاف هستند و تجزیهوتحلیل آماری معیاری عینی از شواهد کمی یکپارچه را به دست میدهد. سوگیریهای ریویوهای روایی را میتوان با انجام یک متاآنالیز محدود کرد یا بر آن غلبه کرد. رویکرد سیستماتیک و شفافیت در متاآنالیز به حل تعارضات و عدم قطعیتهای بین مطالعات کمک میکند، درحالیکه منجر به نتیجهگیری قابلتوجهی میشود. هدف متاآنالیز گردآوری حجم زیادی از اطلاعات در مورد یک موضوع معین است.
متاآنالیز روشی است که بهطور گسترده در تمام زمینههای تحقیقات زیست پزشکی برای تفسیر کلی مطالعات متعدد و متنوع و گاه متناقض استفاده میشود. همچنین توسط جوامع آموخته در یکرشته پزشکی برای ایجاد توصیههایی برای مراقبت و درمان بیماران بر اساس شواهد استفاده میشود. اولین متاآنالیزها به دهه 1970 برمیگردد و تعداد آنها از آن زمان به بعد افزایشیافته است.[2]
چرا متاآنالیز انجام دهیم؟
متاآنالیز تلفیق و ترکیبی از مطالعات مختلفی است که در مورد یک موضوع خاص وجود دارد و امکان استحکام و شفافسازی نتایج حاصل از مطالعات مختلف را فراهم میکند. بهمحض انجام چندین مطالعه که پاسخگویی به یک سؤال را بهعنوان یک هدف اولیه یا ثانویه انجام دادهاند، متاآنالیز امکانپذیر میشود. اینیک روش ضروری برای سنتز مطالعات است و این امکان را فراهم میکند تا پاسخ دقیق و جهانی مطابق با تمام دانش روز ارائه شود. دامنه فقط محدود به مطالعات موجود است. اولین حوزه کاربرد، ارزیابی اثربخشی و عوارض جانبی درمانهای دارویی است. متاآنالیز همچنین میتواند در زمینههای دیگر مانند اپیدمیولوژی، مدیریت درمانی، مراقبت بهطورکلی، غربالگری یا تشخیص بسیار مفید باشد.
در مورد مطالعات روی یک دارو، متاآنالیز میتواند بهاندازه گیری اثربخشی و تحمل این دارو کمک کند. درواقع، گردآوری مطالعات بالینی مختلف که هرکدام شامل تعداد کمی از بیماران است، افزایش این تعداد را ممکن میسازد تا مشاهدات از نظر آماری معنیدار باشند. پسازآن، متاآنالیز میتواند تأثیر یک درمان را برجسته کند، زمانی که کار آزمایی های کوچک لزوماً اجازه نمیدهد که نتیجهگیری شود. انجام یک کارآزمایی بالینی در مقیاس بزرگ در عمل بسیار دشوار است. متاآنالیز بر این مشکل غلبه میکند. همچنین میتواند به تصمیمگیری، زمانی که نتایج متناقض هستند، کمک کند. سمت ترکیبی آن نیز امکان جمعآوری دادهها را برای دستیابی به پاسخ دقیق به یک سؤال فراهم میکند. این امر بهویژه در زمینههای تحقیقاتی که دادهها در آنها جمع میشود مفید است.[3]
یک متاآنالیز چگونه انجام میشود؟
در پزشکی برای انجام یک متاآنالیز، محقق موضوع موردنظر را تعریف میکند که میتواند درمانی باشد که باید آزمایش شود، یک نوع بیمار ارزیابی میشود، دادههای اپیدمیولوژیک، مفاهیم مراقبت و غیره.
مرحله دوم، تعریف معیارهای گنجاندن در متاآنالیز موردنظر است. سپس محقق به دنبال آزمایشها و مطالعات مختلف، منتشرشده یا غیر منتشرشده در ادبیات پزشکی میگردد. این مطالب میتواند مقالات، پوسترها، ارتباطات کنفرانسهای پزشکی، پایاننامههای دانشجویی، کارآزمایی های بالینی و غیره باشد. در صورتی انتخاب میشوند که معیارهای ورود در متاآنالیز را داشته باشند. ایده این است که تا حد امکان بسیاری از مطالعات را در متاآنالیز گرد هم بیاوریم تا بیشترین ارزش و قدرت ممکن را به آن بدهیم.
سپس از تکنیکهای تحلیل آماری استفاده میشود. تجزیهوتحلیل بر اساس زیر گروهها (جنس، سن، سابقه پزشکی، نوع بیماری و غیره) قابل انجام است. بهطورکلی، چندین محقق بهمنظور دادن وزن بیشتر به تجزیهوتحلیل، خوانش های خود را ارجاع متقابل میکنند.[1]
مقایسه متاآنالیز و ریویو روایی
دادههای آنالیز شده از متاآنالیز معمولاً سودمندتر از نتایج ریویوهای روایی هستند، زیرا دومی دارای معایب متعددی است که میتوان با متاآنالیز بر آنها غلبه کرد. ریویوهای روایی بر اساس انتخاب ذهنی از انتشارات است؛ بنابراین، انتخاب مطالعه میتواند دلخواه باشد. در یک ریویو روایی، فقدان یک استراتژی جستجوی خاص، خطر شکست در شناسایی مطالعات مرتبط در یک موضوع خاص را افزایش میدهد. علاوه بر این، مطالعات انتخابشده ممکن است بهطور انتقادی ارزیابی نشوند، قدرت شواهد ممکن است وزن نداشته باشند و ممکن است هیچ تحلیل کمی روی دادهها انجام نشده باشد. در ریویوهای روایی، ممکن است مقایسه اثرات مطالعاتی که از معیارهای متفاوتی برای اندازهگیری یک نتیجه مشابه استفاده میکنند، دشوار باشد. نویسنده در یک ریویو روایی بهطور کیفی با جمعبندی یافتههای مطالعات دیگر و نتیجهگیری به یک سؤال میپردازد؛ بنابراین، ریویوهای روایی مستعد سوگیری و خطا هستند، زیرا بازبینان مختلف ممکن است نتایج متفاوتی از شواهد یکسان بگیرند؛ بنابراین، ریویوهای روایی باید نظراتی با سطح شواهد پایین در نظر گرفته شوند. ازاینرو، ترکیبهای تحقیقاتی سیستماتیک شفافتر و تکرارپذیرتر ممکن است در صورت وجود اختلافنظر بین نتایج مطالعات، هرگونه عدم قطعیت را حل کند. متاآنالیز با بهکارگیری یک رویکرد روششناختی سوگیری را به حداقل میرساند. در متاآنالیز، تصمیمات شفاف هستند و تجزیهوتحلیل آماری به یک اندازهگیری عینی از شواهد کمی یکپارچه منجر میشود که سپس میتواند تکرار و تأیید شود. علاوه بر این، متاآنالیز نتایج مطالعات اولیه را به یک متریک مشترک بهعنوان اندازه اثر تبدیل میکند، بنابراین معیارهای متفاوت از مطالعات اولیه را میتوان با یکدیگر مقایسه کرد و نتیجهگیریهایی را به دست آورد که معنادارتر هستند. با انجام یک متاآنالیز، میتوان سوگیریهای ریویوهای روایتی را محدود یا بر آن غلبه کرد؛ بنابراین، متاآنالیز برای ارائه شواهد با بالاترین سطح دقت در نظر گرفته میشود.[4]
نقاط قوت متاآنالیز
متاآنالیز میتواند نتایج حاصل از مطالعات فردی را خلاصه و کمی کند. علاوه بر این، میتواند ناهمگونی بین نتایج مطالعات مختلف را روشن کند و تفاوتها را در نتایج تحلیل کند. یک مطالعه فردی ممکن است شامل تعداد بسیار کمی از افراد در یک زیرگروه خاص باشد. بااینحال، دادههای متا تحلیلی از چندین مطالعه فردی ممکن است تصویر واضحتری از زیرگروه ارائه دهد. متاآنالیز با افزایش حجم نمونه، قدرت آماری را افزایش میدهد و میتواند با ترکیب دادههای مطالعات متعدد، اثرات کوچک اما ازنظر بالینی مهم را تعیین کند.
دقت یافتههای یک مطالعه تا حد زیادی به تعداد افراد بستگی دارد. ترکیب آماری دادههای مطالعات فردی میتواند تخمین دقیقتری از اثرات اساسی نسبت به یک مطالعه ارائه دهد؛ بنابراین، متاآنالیز بر محدودیت حجم نمونه کوچک مطالعات فردی غلبه میکند، اثرات موردعلاقه را تشخیص میدهد و خطر نتایج منفی کاذب را کاهش میدهد. علاوه بر این، متاآنالیز میتواند اختلافات ناشی از مطالعات با نتایج متناقض را حل کند. علاوه بر این، ترکیب مطالعات اولیه با اندازه نمونه و جمعیت بیماران مختلف میتواند تعمیمپذیری نتایج مطالعات فردی را افزایش دهد. این اجازه میدهد تا نتایج متاآنالیز به جمعیت وسیعتری تعمیم داده شود. بررسی مناسب ناهمگونی بین مطالعات فردی امکان آزمایش فرضیههای جدیدی را فراهم میکند که در مطالعات قبلی ارائه نشدهاند. همانطور که متاآنالیز دانش موجود را خلاصه میکند، ممکن است به شناسایی حوزههایی که فاقد شواهد کافی هستند کمک کند و درنتیجه سؤالات پژوهشی جدیدی ایجاد کند. متاآنالیز بر مشکلات و سوگیریهای ریویو روایت سنتی از طریق فرآیندی شفافتر و ذهنیتر که شامل رویکرد روششناختی سیستماتیک است، غلبه میکند.[5]
نقاط ضعف متاآنالیز
خلاصه کردن مقادیر زیادی از اطلاعات مختلف با استفاده از یک عدد واحد، جنبه بحثبرانگیز متاآنالیز است، زیرا این واقعیت را نادیده میگیرد که اثرات درمان ممکن است از مطالعهای به مطالعه دیگر متفاوت باشد. بااینحال، یک متاآنالیز نتایج را باوجود تفاوت در تحقیقات اولیه تعمیم میدهد و بهسادگی یک اثر خلاصه را گزارش نمیکند. اگر ناهمگونی قابلتوجهی وجود داشته باشد، آنگاه تمرکز باید از اثر خلاصه به خود ناهمگنی تغییر کند. متاآنالیز ابزارهای مختلفی را برای ارزیابی الگوی ناهمگونی و احتمالاً توضیح آن فراهم میکند.[6]
• مخلوط کردن سیب و پرتقال
دو انتقاد اصلی به متاآنالیز این است که انواع مختلف مطالعات ("مخلوط کردن سیب و پرتقال ") را ترکیب میکند و این که اثر خلاصه ممکن است تفاوتهای مهم بین مطالعات را نادیده بگیرد. اگر مطالعات بیشازحد ناهمگن هستند و قابلمقایسه نیستند، باید از متاآنالیز اجتناب شود، زیرا نتایج متاآنالیز ممکن است بیمعنی باشد و اثرات واقعی ممکن است مبهم باشد. بااینحال، متاآنالیز ها، به دلیل ماهیت خود، به سؤالات گستردهتری نسبت به مطالعات فردی میپردازند؛ بنابراین، میتوان گفت که یک متاآنالیز مشابه پرسیدن سؤالی در مورد میوهها است که هم سیب و هم پرتقال میتوانند اطلاعات ارزشمندی را برای آن به اشتراک بگذارند.[7]
• ورودی اشتباه خروجی اشتباه
عبارت «ورودی اشتباه خروجی اشتباه» به این معنی است که اگر یک متاآنالیز شامل مطالعات باکیفیت پایین باشد، نتایج آن مغرضانه و نادرست خواهد بود. متاآنالیز شامل مجموعهای از معیارها برای تعیین اینکه کدام مطالعه باید تجزیهوتحلیل شود. ازاینرو، فرا تحلیل باید بر اساس معیارهای سختگیرانه تری در رابطه با کیفیت مطالعاتی که باید گنجانده شود، باشد. هنگامیکه مطالعات موجود ناقص هستند، یک متاآنالیز ممکن است از تحلیلهای حساسیت برای شناسایی تأثیر سوگیریهای مطالعه استفاده کند.[7]
• ناهمگونی
در متاآنالیز، ناهمگونی به میزان عدم تشابه در نتایج مطالعات فردی اشاره دارد. فرض اصلی برای انجام متاآنالیز این است که مطالعات ازنظر جمعیت، مداخلات، کنترلها و پیامدها همگن هستند. ارزیابی ناهمگونی بین مطالعات اولیه گام مهمی در انجام یک متاآنالیز است. اگر ناهمگونی قابلتوجهی وجود داشته باشد، تمرکز تحلیل باید بر کاوش و درک منابع تنوع باشد. متاآنالیز وجود ناهمگونی را در میان مطالعات اولیه بررسی میکند و واریانس نتایج آنها را تحلیل میکند. برای کشف منابع ناهمگونی از تحلیلهای زیرگروهی و متارگرسیون استفاده میشود. بااینحال، اگر مقدار قابلتوجهی ناهمگونی وجود داشته باشد، ممکن است ادغام دادهها در یک متاآنالیز مناسب نباشد.[8]
• سوگیری مقالات
مطالعاتی که اثرات مثبت را گزارش میکنند معمولاً بیشتر از آنهایی که منتشر نمیکنند منتشر میشوند و مطالعاتی که نتایج قابلتوجهی را گزارش نمیکنند معمولاً منتشرنشده باقی میمانند. ازآنجاییکه متاآنالیز فقط شامل مطالعات منتشرشده است، ممکن است میزان واقعی یک اثر را بیشازحد برآورد کند. این نتیجه "سوگیری انتشار " نامیده میشود. برای کاهش تأثیر سوگیری انتشار بر فرا تحلیل، باید تلاش جدی برای شناسایی همه مطالعات مرتبط انجام شود، زیرا نتیجه فرا تحلیل به مطالعات گنجاندهشده بستگی دارد. اگر مشکوک به وجود سوگیری انتشار باشد، گاهی اوقات میتوان آن را با استفاده از نمودارهای قیف و آمارهای مربوطه، مانند آزمون رگرسیون خطی ایگر برای اندازهگیری عدم تقارن نمودار قیف یا روش «تریم و پر کردن» برای تنظیم تخمینهای خلاصه سوگیری مشاهدهشده تشخیص داد.[7]
• همه متغیرها قابلمقایسه نیستند
برخی از متغیرها معیار قابلمقایسهای برای متاآنالیز ندارند؛ بنابراین، گاهی اوقات ممکن است نیاز به ساخت متغیرهای جدیدی باشد که مفاهیم قابلمقایسهای را ارائه دهند یا تحلیلها را به عناصر مشترک محدود کنند.
• متاآنالیز میتواند با آزمایشهای تصادفی مخالف باشد
دلیل اصلی اختلاف در متاآنالیز این است که بر اساس مطالعات ناهمگن و اغلب کوچک است. افراد در مطالعات فردی ممکن است با توجه به معیارهای تشخیصی، بیماریهای همراه، شدت بیماری و منطقه جغرافیایی متفاوت باشند. در مقابل، در آزمایشهای تصادفی و کنترلشده بزرگ، جمعیت هدف محدودتر است. بااینحال، متاآنالیز که بهدرستی انجام شود ممکن است اطلاعات ارزشمند تکمیلی را ارائه دهد.[4]
• متاآنالیز نمیتواند بر ذهنیت غلبه کند
متاآنالیز بهجای عینیت، بر ذهنیت مشترک متکی است. هنگام تصمیمگیری در مورد اینکه چگونه مطالعات مشابه باید قبل از ترکیب آنها مناسب باشد، اغلب مقدار مشخصی ذهنیت وجود دارد. هر شکلی از تحلیل، ازجمله ریویوهای روایی، نیاز به تصمیمات ذهنی خاصی دارد. بااینحال، چنین تصمیماتی همیشه بهصراحت در یک متاآنالیز بیان میشود.
• متاآنالیز فقط به اثرات اصلی میپردازد
متاآنالیز به اثرات اصلی میپردازد و نتایج آن را میتوان به جامعه هدف تعمیم داد. بااینحال، اثرات متقابل ممکن است با تحلیل تعدیلکننده نیز بررسی شود.
فرآیند پنج مرحلهای
در مورد بهترین روش برای متاآنالیز بحث وجود دارد، بااینحال پنج مرحله متداول در ادامه بیانشده است.
مرحله 1: سؤال تحقیق
یک سؤال تحقیق بالینی شناساییشده و یک فرضیه پیشنهاد میشود. اهمیت احتمالی بالینی توضیح دادهشده و طرح مطالعه و طرح تحلیلی توجیه میشود.
مرحله 2: بررسی سیستماتیک
یک مرور سیستماتیک (SR) بهطور خاص برای رسیدگی به سؤال تحقیق طراحیشده و برای شناسایی همه مطالعاتی که هم مرتبط و هم باکیفیت کافی خوب در نظر گرفته میشوند، انجام میشود تا گنجاندن آن را تضمین کند. اغلب، تنها مطالعات منتشرشده در مجلات معتبر شناسایی میشوند، اما شناسایی دادههای «منتشرنشده» برای جلوگیری از «سوگیری انتشار» یا حذف مطالعات با یافتههای منفی مهم است. برای شواهد با بالاترین کیفیت سایر انواع مطالعات "تجربی " و "نیمه تجربی " درصورتیکه معیارهای ورود/خروج تعریفشده را برآورده کنند، ممکن است شامل شوند.
مرحله 3: استخراج دادهها
پس از انتخاب مطالعات برای گنجاندن در متاآنالیز، دادهها یا نتایج خلاصه از هر مطالعه استخراج میشوند. علاوه بر این، اندازه نمونه و اندازهگیری تنوع دادهها برای هر دو گروه مداخله و کنترل موردنیاز است. بسته به مطالعه و سؤال تحقیق، معیارهای نتیجه میتواند شامل معیارهای عددی یا معیارهای طبقهبندی باشد. بهعنوانمثال، تفاوت در نمرات یک پرسشنامه یا تفاوت در سطح اندازهگیری مانند فشارخون بهعنوان یک میانگین عددی گزارش میشود. بااینحال، تفاوت در احتمال قرار گرفتن در یک دسته در مقابل دسته دیگر (بهعنوانمثال، زایمان طبیعی در مقابل زایمان سزارین) معمولاً ازنظر اقدامات خطر مانند OR یا خطر نسبی (RR) گزارش میشود.
مرحله 4: مطالعات استانداردسازی و وزن دهی
با جمعآوری تمام دادههای لازم، مرحله چهارم محاسبه شاخصهای خلاصه مناسب از هر مطالعه برای تجزیهوتحلیل بیشتر است. این معیارها معمولاً اندازه اثر نامیده میشوند و نشاندهنده تفاوت میانگین نمرات بین گروه مداخله و کنترل است. بهعنوانمثال، تفاوت در تغییر فشارخون بین شرکتکنندگان مطالعه که از داروی X استفاده میکردند در مقایسه با شرکتکنندگانی که از دارونما استفاده میکردند. ازآنجاییکه واحدهای اندازهگیری معمولاً در مطالعات شامل متفاوت است، معمولاً برای ایجاد تخمینهای قابلمقایسه از این اثر، باید «استاندارد» شوند. هنگامیکه معیارهای نتیجه متفاوتی استفاده میشود، مانند زمانی که محققان از آزمونهای مختلف استفاده میکنند، استانداردسازی ضروری است. استانداردسازی با در نظر گرفتن میانگین نمره برای هر مطالعه برای گروه مداخله، کسر میانگین برای گروه کنترل و تقسیم این نتیجه بر معیار متغیر در آن مجموعه داده به دست میآید.
نتایج برخی از مطالعات نیاز به وزن بیشتری نسبت به سایرین دارند. تصور میشود که مطالعات بزرگتر (همانطور که با اندازههای نمونه اندازهگیری میشوند) تخمین اندازه اثر دقیقتری را نسبت به مطالعات کوچکتر ایجاد میکنند. دوم، مطالعات با تنوع داده کمتر، بهعنوانمثال، SD کوچکتر یا CI باریکتر اغلب بهعنوان "کیفیت بهتر " در طراحی مطالعه در نظر گرفته میشوند. یک آمار وزنی که به دنبال ترکیب این دو عامل است که بهعنوان واریانس معکوس شناخته میشود، معمولاً استفاده میشود.
مرحله 5: برآورد نهایی اثر
مرحله نهایی انتخاب و اعمال یک مدل مناسب برای مقایسه اندازه اثر در مطالعات مختلف است. رایجترین مدلهای مورداستفاده، مدلهای جلوههای ثابت و جلوههای تصادفی هستند. مدلهای اثرات ثابت بر این فرض استوارند که هر مطالعه یک اثر درمانی مشترک را ارزیابی میکند. این به این معنی است که فرض بر این است که اگر سطوح مختلف تنوع نمونه در مطالعات مختلف نبود، همه مطالعات اندازه اثر یکسانی را تخمین میزنند. در مقابل، مدل اثرات تصادفی «فرض میکند که اثرات درمانی واقعی در مطالعات فردی ممکن است با یکدیگر متفاوت باشد». اینکه آیا این منبع دوم تنوع احتمالاً مهم است یا نه اغلب در فرا تحلیل با آزمایش «ناهمگونی» ارزیابی میشود.[3]
طرح جنگلی
تخمینهای نهایی از یک متاآنالیز اغلب بهصورت گرافیکی در قالب «طرح جنگل» گزارش میشوند.
در نمودار فرضی Forest Plot نشان دادهشده در شکل زیر، برای هر مطالعه، یک خط افقی تخمین اندازه اثر استانداردشده (جعبه مستطیلی در مرکز هر خط) و 95٪CI برای نسبت ریسک استفادهشده را نشان میدهد. برای هر یک از مطالعات، داروی X خطر مرگ را کاهش داد (نسبت خطر کمتر از 1.0 است). بااینحال، مطالعه اول بزرگتر از دو مطالعه دیگر بود (اندازه جعبهها نشاندهنده وزن نسبی محاسبهشده توسط متاآنالیز است). شاید، به همین دلیل، تخمینها برای دو مطالعه کوچکتر ازنظر آماری معنیدار نبودند (خطوط برخاسته از جعبه آنها شامل مقدار 1 است). هنگامیکه هر سه مطالعه در متاآنالیز ترکیب شدند، همانطور که توسط الماسنشان داده شد، تخمین دقیقتری از اثر دارو به دست میآوریم، جایی که الماس هم تخمین نسبت ریسک ترکیبی و هم حدود 95٪CI را نشان میدهد. [7]
ارتباط با تمرین و تحقیق
بسیاری از تفسیرهای پرستاری مبتنی بر شواهد دارای ریویو سیستماتیک و متاآنالیز اخیراً منتشرشده هستند زیرا نهتنها بینش یا قدرت جدیدی را به توصیههایی در مورد مؤثرترین شیوههای مراقبت بهداشتی میآورند، بلکه همچنین مشخص میکنند که تحقیقات آینده باید به کجا انجام شود تا شکافها یا محدودیتهای موجود در شواهد فعلی را پر کند. قدرت نتیجهگیری از متاآنالیز تا حد زیادی به کیفیت دادههای موجود برای سنتز بستگی دارد. این نشاندهنده کیفیت مطالعات فردی و بررسی سیستماتیک است. متاآنالیز بهطور جادویی مشکل مطالعات ضعیف یا طراحی ضعیف را حل نمیکند و پزشکان میتوانند ناامید شوند و متوجه شوند که حتی زمانی که یک متاآنالیز انجامشده است، تنها چیزی که محققان میتوانند به این نتیجه برسند این است که شواهد ضعیف هستند و عدم اطمینان در مورد آن وجود دارد. اثرات درمان و اینکه برای اطلاعرسانی بهتر به تحقیقات با کیفیت بالاتر نیاز است. این هنوز یک یافته مهم است و میتواند عملکرد ما را آگاه کند و ما را به چالش بکشد تا شکافهای شواهد را با تحقیقات باکیفیت بهتر در آینده پر کنیم.[5]
خلاصه
متاآنالیز یک تحلیل آماری است که نتایج مطالعات علمی متعدد را ترکیب میکند. متاآنالیزها را میتوان زمانی انجام داد که مطالعات علمی متعددی وجود داشته باشد که به یک سؤال پاسخ میدهند و هر مطالعه جداگانه اندازهگیریهایی را گزارش میکند که انتظار میرود درجاتی از خطا داشته باشد. سپس هدف استفاده از رویکردهای آماری برای استخراج تخمین تلفیقی نزدیک به حقیقت رایج ناشناخته بر اساس نحوه درک این خطا است. نتایج متاآنالیز معتبرترین منبع شواهد در ادبیات پزشکی مبتنی بر شواهد در نظر گرفته میشوند.
متاآنالیز تخمین دقیقتری از اندازه اثر ارائه میدهد و قابلیت تعمیم نتایج مطالعات فردی را افزایش میدهد؛ بنابراین، ممکن است امکان حل تعارضات بین مطالعات را فراهم کند و زمانی که مطالعات فردی غیرقابل قطعیت هستند، نتایج قطعی به همراه داشته باشد. بااینحال، اخطارهای زیادی در کاربرد متاآنالیز وجود دارد. نتیجهگیریهای بهدستآمده از فرا تحلیل مستعد کیفیت روششناختی مطالعات گنجاندهشده و همچنین سوگیری انتشار و فرمولبندی معیارهای واجد شرایط بودن هستند. اگرچه ترکیب دادههای حاصل از مطالعات مستقل با استفاده از روشهای فرا تحلیلی میتواند دقت آماری را بهبود بخشد، اما نمیتواند بهطورکلی از سوگیری جلوگیری کند. بااینحال، بسیاری از انتقادات متاآنالیز برای ریویوهای روایی نیز صادق است. اگرچه فرا تحلیل به دلیل محدودیتهایش موردانتقاد قرار میگیرد، اما راهحلهایی برای این مشکلات وجود دارد. یک رویکرد سیستماتیک و شفافیت در انجام متاآنالیز به حل تعارضات و عدم قطعیتهای بین مطالعات و به دست آوردن نتیجهگیریهای معنادار کمک میکند. استفاده و ارزش متاآنالیز احتمالاً در آینده بر اساس قدرت آن در آشکارسازی یافتههای جدید افزایش مییابد.
منابع
[1] L. V Hedges, “Meta-analysis,” J. Educ. Stat., vol. 17, no. 4, pp. 279–296, 1992.
[2] I. K. Crombie and H. T. Davies, “What is meta-analysis,” What is, vol. 1, no. 8, 2009.
[3] A. P. Field and R. Gillett, “How to do a meta‐analysis,” Br. J. Math. Stat. Psychol., vol. 63, no. 3, pp. 665–694, 2010.
[4] R. Rosenthal and M. R. DiMatteo, “Meta-analysis: Recent developments in quantitative methods for literature reviews,” Annu. Rev. Psychol., vol. 52, no. 1, pp. 59–82, 2001.
[5] M. Borenstein, L. V Hedges, J. P. T. Higgins, and H. R. Rothstein, Introduction to meta-analysis. John Wiley & Sons, 2021.
[6] R. A. Guzzo, S. E. Jackson, and R. A. Katzell, “Meta-analysis analysis,” Res. Organ. Behav., vol. 9, no. 1, pp. 407–442, 1987.
[7] M. Egger, G. D. Smith, and A. N. Phillips, “Meta-analysis: principles and procedures,” Bmj, vol. 315, no. 7121, pp. 1533–1537, 1997.
[8] M. Egger and G. D. Smith, “Meta-analysis: potentials and promise,” Bmj, vol. 315, no. 7119, pp. 1371–1374, 1997.
معرفی پایگاه های مهم و کاربردی.
6. acs.org انجمن شیمی آمریکا
7. aiaa.org ترسیم آینده هوا فضا
8. aip.org مجمع اعضای انجمن های فیزیک آمریکا
9. ajpe.org مجله آمریکایی آموزش دارو سازی
10. aps.org انجمن فیزیک آمریکا
11. ascelibrary.org انجمن مهندسین عمران آمریکا
12. asm.org انجمن میکروبیولوژی امریکا
13. asme.org انجمن مهندسان مکانیک آمریکا
14. bioone.org جستوجی ژورنالها و کتابهایی در زمینه های زیست محیطی، زیستی و محیطی
15. birpublications.org انتشارات موسسه انگلیسی رادیولوژی BIR
16. bmj.com انتشارات BMJ
18. emeraldinsight.com انتشارات امرالد EMERALD
19. geoscienceworld.org علوم زمین
20. icevirtuallibrary.com مهندسی عمران
22. informs.org
24. iop.org
25. jamanetwork.com
26. joponline.org
27. jstor.org
28. mitpressjournals.org
29. nature.com
30. nrcresearchpress.com
31. oxfordjournals.org
32. royalsocietypublishing.org
33. rsc.org
34. rubberchemtechnol.org
35. sagepub.com
36. scientific.net
37. spiedigitallibrary.org
38. springermaterials.com
39. tandfonline.com
40. theiet.org
41.سایت هواشناسی جهانی
معرفی سایت هایی جهت دانلود رایگان کتاب
◾️irpdf.com
◾️parsbook.org
◾️irebooks.com
◾️farsibooks.ir
◾️ketabesabz.com
◾️readbook.ir
سایتهای مهم علمی،پژوهشی
بانک های اطلاعاتی
◾️umi.com/pqdauto
◾️search.ebscohost.com
◾️sciencedirect.com
◾️emeraldinsight.com
◾️online.sagepub.com
◾️springerlink.com
◾️scopus.com
◾️apps.isiknowledge.com
◾️anjoman.urbanity.ir
پایان نامه های داخلی و خارجی
◾️irandoc.ac.ir پژوهشگاه علوم و فناوری اطلاعات ایران
◾️mhrn.net شبکه تحقیقات سلامت روان ایران
◾️https://ndltd.org کتابخانه مجازی پایان نامه و تز دکتری
مقالات فارسی
◾️urbanity.ir انجمن شهر سازی
◾️magiran.com بانک اطلاعات نشریات کشور ایران
◾️civilica.com سیویلیکاه پایگاه اطلاع رسانی علمی
◾️sid.ir پایگاه اطلاعات علمی جهاد دانشگاهی
◾️lib.pgu.ac.ir کتابخانه ملی ایران، آمریکا و انگلیس
◾️nlai.ir سازمان اسناد و کتابخانه ملی ایران
◾️loc.gov کتابخانه کنگره ایلات متحده آمریکا
◾️bl.uk کتابخانه انگلستان
دسترسی آزاد روانشناسی و آموزش و پرورش:
◾️eric.ed.gov
اطلاعات عمومی کشورها:
◾️worldatlas.com اطلس کشورهای جهان
مقالات رایگان کتابداری و اطلاع رسانی:
◾️infolibrarian.com
آرشیو مقالات از سال ۱۹۹۸
◾️findarticles.com
کتابخانه الکترونیک
◾️digital.library.upenn.edu/books
رایانه و بانکهای اطلاعاتی :
◾️srco.ir
دانشنامه آزاد اینترنتی:
◾️wikipedia.org
دسترسی به متن کامل پایان نامه های 435 دانشگاه از24 کشور اروپایی:
◾️dart-europe.eu/basic-search.php
دسترسی رایگان به بانک مقالات دانشگاه کالیفرنیا:
◾️escholarship.org
دسترسی رایگان به بانک مقالات دانشگاه TENNESSEE:
◾️lib.utk.edu
دسترسی رایگان به 1,550,632 مقاله ی دانشگاهی:
◾️oalib.com
دسترسی به پایان نامه های الکترونیکی دانشگاه ناتینگهام:
◾️https://www.nottingham.ac.uk
دسترسی رایگان به کتاب ها و ژورنال های سایت In Tech:
◾️intechopen.com
دسترسی رایگان به مقالات علمی ، دانشگاه McGill:
◾️digitool.library.mcgill.ca/R
دسترسی رایگان به مقالات علمی، مقالات 1753 ژورنال- دانشگاه استنفورد:
◾️highwire.stanford.edu
دسترسی به مقالات و متون علمی پایگاه Proceeding of the National Academy of Sciences ایالت متحده ی آمریکا:
◾️pnas.org
بهترین سایت های مهندسی مکانیک
·سایت Magic Marks
این سایت دارای دورههای مختلف برای دانشجویان مهندسی در تمامی سطوح- از مبتدی تا پیشرفتهتراست. همچنین دانشجویان برای سنجش میزان آمادگی خود می توانند در آزمون های این سایت شرکت کنند
·سایت American Society of Mechanical Engineers
این سایت مربوط به جامعه مهندسان مکانیک آمریکا است. اگر علاقه مند به اخبار، رویدادهای علمی و بینالمللی می باشید این سایت برای شما مفید خواهد بود.
·سایت Engineering Central
اگر به فکر پیدا کردن کار در خارج کشور هستید و در یک زمینه خاص تخصص لازم را دارید این سایت به شما کمک زیادی خواهد کرد. کافی است تخصص و کشور موردنظر را انتخاب کنید. این سایت فرصتهای کاری در سراسر دنیا را ه شما معرفی میکند.
·سایتlearnmech
سایت مهندسی مکانیک learnmech توسط یک مهندس مکانیک ساختهشده است و شامل مقالات، پروژهها، سمینار و مفاهیم اصلی مهندسی مکانیک میباشد. این سایت در فیسبوک بیشتر از ۵۰۰۰دنبال کننده دارد. این سایت شامل ویدیوهای آموزش زیادی میباشد.
·سایت MatWeb
این سایت یک منبع شگفتانگیز برای اطلاعات مواد مختلف میباشد. همچنین ه شما اجازه میدهد تا با نام تجاری، سازنده و یا کلمات کلیدی خود به جستوجو بپردازید. همچنین ابزارهای زیادی در این سایت هست که میتواند به شما کمک کند.
·سایتeFunda
سایت مهندسی مکانیک eFunda یک منبع جامع برای کمک به دانشجویان مهندسی مکانیک میباشد. شامل زمینههای مختلف برای مطالعه، معادلات، فرمولها و فرم پرسش و پاسخ برای پرسیدن سؤالات و راهتمایی کردن دیگر دانشجویان میباشد. با عضویت در این سایت میتوانید به محاسبات و فرآیندهای مهندسی، راهنمایی برای طراحی، معادلات و بحثهای دیگر اعضای سایت دسترسی داشته باشید.
این سایت نهتنها بر بخشهای مهندسی تمرکز میکند بلکه در تمام بخشهای زندگی همچون مالی، سبک زندگی، فرهنگ و سرگرمی شامل مقالات زیادی میباشد.
·سایت Eng-links
سایت مهندسی مکانیک Eng-links منبع ابزارهای مهندسی، مانند ماشینحسابها، نمودارهای متریک، لینک منابع و تعدادی زیادی اطلاعات در مورد نرمافزارهای مهندسی برای دانشجویان و مهندسین میباشد. اگر شما به دنبال یک مجله صنعتی منظم هستید این سایت را حتماً چک کنید. در این سایت ۱۰فهرست برتر از بهترین مجلات در مهندسی و سایر نشریات وجود دارد.
·سایت ThomasNet
این سایت یک پلت فرم برای خریداران و تولیدکنندگان برای پیدا کردن همدیگر است. این سایت شامل هزاران مدل سهبعدی و طرحهای صنعتی میباشد. هر چند این سایت بیشتر بر فعالیت شرکتها تمرکز دارد اما دانشجویان و مهندسان و حتی کسانی که عاشق مکانیک هستند میتوانند از این سایت ایده بگیرند.
·سایتAccess Engineering Library
در این سایت میتوانید دنبال هر موضوع مهندسی بگردید و نتایج خوبی را به دست بیاورید. شامل فیلمها و کتابهای زیادی میباشد. بدون صرف هزینههای زیاد برای دورهای که بخواهید شرکت کنید همه اینها را در ک پلت فرم نسخه انلاین میتوانید پیدا کنید. علاوه بر مکانیک میتوانید موضوعات مختلف دیگری از قبیل انرژی، صنعتی، الکترونیک را پیداکنید که میتواند به آموزش شما کمک کند.
دیتاست چیست؟.
دیتاست چیست؟
دیتاست یک مجموعه داده یا مدیریت مجموعهای از دادههاست. این مجموعه معمولاً در یک الگوی جدولی ارائه میشود. اجزای این جدول به صورت زیر میباشند:
- ستونهای جدول: هر ستون، یک متغیر خاص را توصیف میکند.
- ردیفهای جدول: هر ردیف، متناظر با یک عضو داده شده از مجموعه دادهها، طبق سؤال دادهشده است.
تعریفهای متفاوتی از دیتاست وجود دارد که ما تنها یک تعریف از آن را گفتیم. مجموعه دادهها، مقادیر هر متغیر را برای کمیتهای ناشناخته مانند قد، وزن، دما، حجم و غیره یک اندازهگیری واقعی یا آزمایشگاهی توصیف میکنند.
هر جزء از مقادیر این مجموعه بهعنوان یک دیتا یا داده شناخته میشوند. مجموعه دادهها شامل تمامی این دیتاها یا به عبارتی دیگر، شامل تمام ردیفهای این جدول میباشند.
در ادامه، تعریف مجموعه دادهها، انواع مختلف مجموعه دادهها و ویژگیهای آنها را با مثالهای حلشده بسیاری میآموزیم.
خلاصه مطالبی که در ادامه میخوانید به شرح زیر است:
معنا و مفهوم دیتاست
انواع دیتاست:
- مجموعه دادههای عددی
- مجموعه دادههای دومتغیره
- مجموعه داده چند متغیره
- مجموعه دادههای طبقهبندیشده
- مجموعه دادههای همبستگی
- میانگین، میانه، حالت و محدوده
میانگین، میانه، حالت و محدوده دادهها
ویژگیهای دیتاست
مثالهای کاربردی
سؤالات متداول
معنای دیتاست
دیتاست یک مجموعه مرتب از دادهها است. همانطور که میدانیم، مجموعهای از اطلاعات بهدستآمده از طریق مشاهدات، اندازهگیریها، مطالعه یا تحلیل، داده نامیده میشود. این اطلاعات میتواند شامل اطلاعاتی مانند حقایق، اعداد، ارقام، نامها یا حتی توصیفات پایهای اشیا باشد. برای مطالعه ما، دادهها میتوانند به شکل نمودار، نمودار یا جدول سازماندهی شوند. دانشمندان از طریق دادهکاوی به تجزیهوتحلیل دادههای جمعآوریشده کمک میکنند.
یک مجموعه داده مجموعهای از اعداد یا مقادیر است که به یک موضوع خاص مربوط میشود. برای مثال، یک مجموعه داده، نمرات آزمون هر دانشآموز در یک کلاس خاص است. مجموعه دادهها میتوانند به صورت لیستی از اعداد صحیح به ترتیب تصادفی، جدول، یا با براکت های مجعد در اطراف آنها نوشته شوند. مجموعه دادهها معمولاً برچسبگذاری میشوند تا شما بفهمید که دادهها چه چیزی را نشان میدهند، بااینحال، هنگامیکه با مجموعه دادهها سروکار دارید، لزوماً نیازی نیست که بفهمید دادهها نشاندهنده چه چیزی هستند تا مشکل را حل کنید.
انواع مجموعه دادهها
در آمار، ما انواع مختلفی از مجموعه دادهها را برای انواع مختلف اطلاعات در دسترس داریم؛ که عبارتاند از:
- مجموعه دادههای عددی
- مجموعه دادههای دومتغیره
- مجموعه دادههای چندمتغیره
- مجموعه دادههای طبقهبندیشده
- مجموعه دادههای همبستگی
اجازه دهید در مورد تمام این مجموعه دادهها با مثال بحث کنیم.
مجموعه دادههای عددی
مجموعه دادههای عددی یک مجموعه از دادههاست که در آن دادهها با اعداد بیان میشوند. دادههای عددی گاهی دادههای کمی نامیده میشوند. مجموعه تمام دادههای کمی/دادههای عددی را مجموعه دادههای عددی مینامند. دادههای عددی همیشه به شکل اعداد هستند، بهطوریکه میتوانیم عملیات ریاضی را روی آن انجام دهیم.
وزن و قد فرد
شمارش RBC در یک گزارش پزشکی
تعداد صفحات موجود در یک کتاب
مجموعه دادههای دو متغیره
یک مجموعه داده که دو متغیر دارد، مجموعه داده دو متغیره نامیده میشود. مجموعه دادههای دو متغیره معمولاً شامل دو نوع داده مرتبط است.
مثال: یافتن درصد نمره و سن دانش آموزان در یک کلاس. امتیاز و سن را میتوان بهعنوان دو متغیر در نظر گرفت.
فروش بستنی در مقابل دما در آن روز. در اینجا دو متغیر مورد استفاده بستنی و دما هستند.
(توجه: درصورتیکه تنها یک مجموعه داده داشته باشید مثلاً دما، آنگاه مجموعه داده تک متغیره نامیده میشود)
مجموعه دادههای چند متغیره
یک مجموعه داده با چندین متغیر. هنگامی که مجموعه داده شامل سه یا بیش از سه نوع داده (متغیر) باشد، آنگاه مجموعه داده یک مجموعه داده چند متغیره نامیده میشود؛ به عبارت دیگر، مجموعه دادههای چند متغیره شامل اندازهگیریهای فردی است که بهعنوان تابعی از سه یا بیش از سه متغیر به دست میآیند.
مثال: اگر بخواهیم طول، عرض، ارتفاع، حجم یک جعبه مستطیلی را اندازهگیری کنیم، باید از متغیرهای متعددی برای تمایز بین آن موجودیتها استفاده کنیم.
مجموعه دادههای طبقهبندیشده
مجموعه دادههای طبقهبندیشده نشاندهنده ویژگیهای یک شخص یا یک شی است. مجموعه داده طبقهای شامل یک متغیر طبقهبندی است که متغیر کیفی نیز نامیده میشود که میتواند دقیقاً دو مقدار داشته باشد. از این رو، آن را یک متغیر دوگانه مینامند. دادهها/متغیرهای دستهبندی با بیش از دو مقدار ممکن، متغیرهای چندجملهای نامیده میشوند. متغیرهای کیفی/طبقهای اغلب بهعنوان متغیر چندجملهای فرض میشوند، مگر اینکه طور دیگری مشخصشده باشد.
مثال:
جنسیت فرد (مرد یا زن)
وضعیت ازدواج (متأهل / مجرد)
مجموعه دادههای همبستگی
مجموعه مقادیری که رابطهای را با یکدیگر نشان میدهند، مجموعه دادههای همبستگی را نشان میدهند. در اینجا مشخص میشود که مقادیر به یکدیگر وابسته هستند.
بهطور کلی، همبستگی به عنوان یک رابطه آماری بین دو ماهیت / متغیر تعریف میشود. در برخی سناریوها، ممکن است مجبور شوید همبستگی بین چیزها را پیشبینی کنید. درک چگونگی کارکرد همبستگی ضروری است. همبستگی به سه نوع طبقهبندی میشود که عبارتاند از:
- همبستگی مثبت - دو متغیر در یک جهت حرکت میکنند (هر دو بالا هستند یا هر دو یا پایین)
- همبستگی منفی - دو متغیر در جهت مخالف حرکت میکنند. (یک متغیر بالا و متغیر دیگر پایین است و بالعکس)
- همبستگی صفر یا صفر - هیچ رابطهای بین دو متغیر وجود ندارد.
مثال: یک فرد بلند قد سنگینتر از یک فرد کوتاه قد در نظر گرفته میشود؛ بنابراین در اینجا متغیرهای وزن و قد به یکدیگر وابسته هستند.
میانگین، میانه، حالت و محدوده مجموعه دادهها
میانگین، میانه و مد همراه با دامنه، موضوعات اصلی در آمار هستند؛ به عبارت دیگر، محاسبه میانگین، میانه و حالت مجموعه دادهها سه روش برای کار با آنها هستند. با این حال، قبل از اینکه بتوانیم این سه معیار مجموعه داده را محاسبه کنیم، ابتدا باید مجموعه دادههای خود را با بازنویسی آنها به ترتیب صعودی از حداقل تا بیشترین آماده کنیم.
میانگین یک مجموعه داده میانگین تمام مشاهدات موجود در جدول است. این نسبت مجموع مشاهدات به تعداد کل عناصر موجود در مجموعه دادهها است. فرمول میانگین بهصورت زیر است:
میانگین= حجم مشاهدات / تعداد کل عناصر در مجموعه دادهها
میانه یک مجموعه داده، مقدار میانه جمعآوری دادهها زمانی است که به ترتیب صعودی و نزولی مرتبشده باشند.
مود یک مجموعه داده، متغیر یا عدد یا مقداری است که حداکثر چند بار در مجموعه تکرار میشود.
محدوده یک مجموعه داده، تفاوت بین مقدار بیشینه و مقدار کمینه است.
محدوده= حداکثر مقدار - حداقل مقدار
ویژگیهای مجموعه داده
قبل از انجام هر تحلیل آماری, درک ماهیت دادهها ضروری است. ما میتوانیم از تکنیکهای مختلف تحلیل داده اکتشافی (EDA) استفاده کنیم که به شناسایی ویژگیهای دادهها کمک میکند, بهطوریکه روشهای آماری مناسب میتوانند بر روی دادهها اعمال شوند. با کمک تکنیک های EDA میتوانیم ویژگیهای زیر را در مجموعه دادهها بررسی کنیم.
- مرکز دادهها
- Skewness of data
- پخش در میان اعضای داده
- حضور خارجیها
- همبستگی میان دادهها
- نوع توزیع احتمال که دادهها از آن پیروی میکنند
مثال مجموعه دادهها
مثال ۱: میانگین، حالت، میانه و دامنه مجموعه دادههای دادهشده را پیدا کنید. { ۲، ۴، ۶، ۸، ۲، ۱۰، ۱۲}
راهحل: با توجه به اینکه { ۲، ۴، ۶، ۸، ۲، ۱۰، ۱۲ } مجموعهای از دادهها است.
میانگین ۲+۴+۶+۸+۲+۱۰+۱۲/۷ = ۴۴/۷
برای یافتن میانه ابتدا باید دادههای داده شده را به ترتیب صعودی یا نزولی مرتب کنیم.
بنابراین{ ۲، ۲، ۴، ۶، ۸، ۱۰، ۱۲ }
بنابراین، میانه= ۶ مود= ۲ محدوده ۱۲-۲=۱۰
مثال ۲: مود مجموعه دادههای داده شده را پیدا کنید: ۲، ۳، ۳، ۴، ۶، ۷
راهحل: مجموعه دادههای داده شده: ۲، ۳، ۳، ۴، ۶، ۷
میدانیم که مود مقدار تکرار شونده در مجموعه دادهها است.
از مجموعه دادههای داده شده، مشاهده میشود که داده "۳" دو بار تکرار میشود؛ بنابراین، مود برای مجموعه دادههای داده شده ۳ است.
سؤالات متداول در دیتابیس
منظور از مجموعه داده چیست؟
مجموعه یا مجموعهای از دادهها و اطلاعات را مجموعه داده مینامند؛ به عبارت دیگر، مجموعه دادهها مجموعه مرتب اطلاعات و دادهها است.
ویژگیهای مختلف مورد استفاده برای اندازهگیری مجموعه دادهها چیست؟
در آمار، ویژگیهای مختلف مورد استفاده برای اندازهگیری مجموعه دادهها عبارتاند از میانگین، میانه، مود، دامنه و غیره.
چگونه دامنه مجموعه دادههای داده شده را محاسبه کنیم؟
محدوده مجموعه دادههای داده شده، تفاوت بین مقدار بیشینه و کمینه مجموعه دادهها است.
انواع مختلف مجموعه دادهها چیست؟
انواع مختلف مجموعه دادهها عبارتاند از:
- مجموعه دادههای عددی
- مجموعه دادههای دو متغیره
- مجموعه دادههای چند متغیره
- مجموعه دادههای طبقهبندیشده
- مجموعه دادههای همبستگی
میانه مجموعه دادهها چیست؟
میانه مقدار میانی مجموعه داده است که در آن دادهها به ترتیب صعودی مرتب میشوند.
تفاوت بین داده، مجموعه داده و پایگاه داده چیست؟
دادهها مشاهدات یا اندازهگیریهایی (پردازش نشده یا پردازش نشده) هستند که به صورت متن، اعداد یا چندرسانهای نشان داده میشوند. یک مجموعه داده مجموعهای ساختار یافته از دادهها است که به طور کلی با یک مجموعه کار منحصر به فرد در ارتباط است.
پایگاه داده مجموعهای سازمان یافته از دادههای ذخیره شده به صورت مجموعه دادههای چندگانه است. این مجموعه دادهها عموماً به صورت الکترونیکی از یک سیستم کامپیوتری ذخیره و در دسترس هستند که اجازه میدهد دادهها بهراحتی قابل دسترسی، دستکاری و به روز رسانی باشند.
این مقادیر ممکن است اعدادی مانند اعداد حقیقی یا اعداد صحیح باشند، برای مثال نشاندهنده قد یک شخص در سانتیمتر باشند، اما ممکن است دادههای اسمی نیز باشند (شامل مقادیر عددی نباشند)، برای مثال نشاندهنده قومیت یک شخص. به طور کلی، مقادیر ممکن است از هر یک از انواعی باشند که به عنوان سطحی از اندازهگیری توصیف میشوند. برای هر متغیر، مقادیر به طور معمول همگی از یک نوع هستند. با این حال، ممکن است مقادیر گم شده ای نیز وجود داشته باشد که باید به نحوی نشان داده شوند.
در آمار، مجموعه دادهها معمولاً از مشاهدات واقعی به دست آمده از نمونهگیری یک جامعه آماری به دست میآیند و هر ردیف مربوط به مشاهدات یک عنصر از آن جامعه است. مجموعه دادهها ممکن است بیشتر توسط الگوریتمها به منظور آزمایش انواع خاصی از نرمافزارها تولید شوند. برخی از نرمافزارهای تحلیل آماری مدرن مانند SPSS هنوز هم دادههای خود را به شیوه مجموعه دادههای کلاسیک ارائه میدهند. اگر دادهها گم شده یا مشکوک باشند، میتوان از یک روش ایمنسازی برای تکمیل یک مجموعه داده استفاده کرد.
چندین مجموعه داده کلاسیک به طور گسترده در منابع آماری مورد استفاده قرار گرفتهاند:
مجموعه دادههای گل آیریس - مجموعه دادههای چند متغیره معرفیشده توسط رونالد فیشر (۱۹۳۶).
پایگاه داده MNIST - تصاویر ارقام دستنویس که معمولاً برای آزمایش الگوریتمهای طبقهبندی، خوشهبندی و پردازش تصویر استفاده میشوند.
تجزیهوتحلیل دستهای دادهها - مجموعه دادههای مورداستفاده در کتاب، مقدمهای بر تجزیهوتحلیل دستهای دادهها.
آمار قوی - مجموعه دادههای مورداستفاده در رگرسیون قوی و تشخیص دور از دسترس (روسسو و لروی، ۱۹۶۸). در دانشگاه کلن ارائه شد.
سریهای زمانی - دادههای مورد استفاده در کتاب چاتفیلد، تجزیه و تحلیل سریهای زمانی، به صورت آنلاین توسط StatLib ارائه میشوند.
مقادیر افراطی - دادههای مورد استفاده در این کتاب، مقدمهای بر مدلسازی آماری مقادیر افراطی، تصویری از دادههایی است که توسط استوارت کولز، نویسنده کتاب، بهصورت آنلاین ارائه شده است.
تجزیه و تحلیل دادههای بیزی - دادههای مورد استفاده در این کتاب توسط اندرو گلمن، یکی از نویسندگان کتاب به صورت آنلاین ارائه شده است.
دادههای باگ بانتی در چندین مقاله در منابع یادگیری ماشین (داده کاوی) مورد استفاده قرار میگیرند.
مجموعه دادههای کوچک - کوارتت آنسکامب نشاندهنده اهمیت نمودار کردن دادهها برای جلوگیری از مغالطههای آماری است.
درگاههای متعددی وجود دارند که به مجموعه دادهها دسترسی دارند:
- دادهکاوی در بریتانیا
- دادهکاوی در آمریکا
- دنیای ما در دادهها
- پنج و سی وهشت
- کار با دادهها