نگارش پروپوزال ارشد و دکتری…
Proposal…
پایان نامه ارشد و رساله دکتری…
Dissertation…
نگارش، استخراج و تقویت مقاله…
Article…
پروپوزال نیوز
تز نیوز
پیپر نیوز
معرفی و آموزش نرم افزار (3)stata.
فایل دستورات (Do-file): فایل دستورات در Stata به نام "Do-file" شناخته میشود و پسوند آن ".do" است. این فایل برای ذخیره مجموعهای از دستورات برای تحلیل دادهها استفاده میشود. دستورات ذخیره شده در یک Do-file میتوانند هر زمان که لازم باشد دوباره استفاده یا اجرا شوند. دستورات میتوانند مستقیماً نوشته شوند و یا در یک Do-file ویرایش شوند برای تحلیل.
فایل دادهای
باز کردن (دریافت) یک فایل دادهای موجود
در بخش قبلی (بخش 2)، ما نحوه ایجاد یک فایل دادهای در Stata را بررسی کردیم. اگر شما قبلاً یک فایل دادهای Stata روی کامپیوتر خود ذخیره کردهاید، میتوانید آن را به روشهای مختلف باز کنید، مانند استفاده از منوی کشویی، نوشتن دستور یا استفاده از آیکون.
فرض کنید که شما یک فایل دادهای Stata به نام "Data_3.dta" روی کامپیوتر خود دارید و مکان آن C:\Users\HP\Desktop است. اگر بخواهید فایل دادهای را باز کنید، مراحل یا دستور زیر را دنبال کنید:
از منوی File (در نوار منو) > Open > به دسکتاپ بروید و فایل دادهای "Data_3" را انتخاب کنید > Open
یا از دستور زیر استفاده کنید:
C:\Users\HP\Desktop\Data_3, clear |
یا روی آیکون کلیک کنید > به دسکتاپ بروید > "Data_3" را انتخاب کنید > Open
یا روی فایل دادهای که میخواهید باز کنید دوبار کلیک کنید.
فایل خروجی یا فایل لاگ
هنگامی که شما دادهها را تحلیل میکنید، خروجیها (نتایج) در پنجره نتایج Stata نمایش داده میشوند. خروجیها به طور خودکار ذخیره نمیشوند و شما باید آنها را در یک فایل ذخیره کنید. در Stata، فایلهای خروجی "فایلهای لاگ" نامیده میشوند. فایلهای لاگ خروجیها و دستورات را شامل میشوند، اما گرافها را شامل نمیشوند. گرافهایی که در Stata تولید میشوند باید به طور جداگانه ذخیره شوند.
ذخیره خروجیها در فایل لاگ
فایل لاگ میتواند در دو فرمت مختلف ذخیره شود:
فرمت Stata (که به فرمت smcl هم معروف است): در این فرمت، فایل لاگ پسوند ".smcl" خواهد داشت. فایلهای لاگ در فرمت Stata فرمتهایی که در پنجره نتایج میبینیم را حفظ میکنند و این فرمت پیشفرض است.
فرمت ASCII: در فرمت ASCII (متن عادی)، فایل پسوند ".log" خواهد داشت.
ما معمولاً از فرمت Stata (فرمت smcl) برای ذخیره خروجیها استفاده میکنیم. با این حال، فرمت "smcl" میتواند در صورت لزوم به فرمت "ASCII" تبدیل شود.
فرض کنید که شما میخواهید دادههای خود را تحلیل کرده و خروجیها را در فایلی به نام "Results_3" ذخیره کنید. برای ذخیره خروجیها، در ابتدای تحلیل فایل لاگ را ایجاد کنید (شما همچنین میتوانید فایل لاگ را در میانه تحلیل ایجاد کنید) با استفاده از گزینههای نوار منو یا دستور به شرح زیر:
از منوی File (در نوار منو) > Log > Begin... > مکان ذخیره فایل را انتخاب کنید > نام "Results_3" را در جعبه "File name" وارد کنید > فرمت .smcl را انتخاب کنید (معمولاً پیشفرض) > Save
یا از دستور زیر استفاده کنید:
log using C:\Users\HP\Desktop\Results_3 |
دستور بالا فایل لاگ با نام "Results_3.smcl" را در دسکتاپ باز/ایجاد میکند.
پس از باز شدن فایل لاگ، شما میتوانید هر زمان که خواستید ذخیره خروجیها را به طور موقت متوقف کنید (تعلیق کنید) با استفاده از مراحل یا دستور زیر:
File > Log > Suspend
یا از دستور زیر استفاده کنید:
log off |
شما میتوانید ذخیره خروجیها را در هر نقطه از جلسه تحلیل خود از سر بگیرید با استفاده از مراحل یا دستور زیر:
File > Log > Resume
یا از دستور زیر استفاده کنید:
log on |
فایل لاگ به طور خودکار در پایان جلسه تحلیل زمانی که از Stata خارج میشوید ذخیره و بسته میشود. با این حال، شما میتوانید هر زمان که خواستید فایل لاگ را ذخیره و ببندید با استفاده از مراحل یا دستور زیر:
File > Log > Close
یا از دستور زیر استفاده کنید:
log close |
باز کردن یک فایل لاگ موجود
برای باز کردن یک فایل لاگ موجود که قبلاً روی کامپیوتر شما ذخیره شده است (مثلاً شما میخواهید فایل "Results_3.smcl" را که در دسکتاپ ذخیره شده است باز کنید)، مراحل زیر را دنبال کنید:
File > Log > View > Browse > فایل "Results_3" را از دسکتاپ انتخاب کنید > Open > Ok
اگر میخواهید نتایج تحلیل جدیدی را به فایل لاگ قبلاً ذخیره شده اضافه (ضمیمه) کنید (مثلاً "Results_3.smcl")، مراحل یا دستور زیر را دنبال کنید:
File > Log > Begin > فایل "Results_3" را از دسکتاپ (یا از محلی که ذخیره شده است) انتخاب کنید > Save > Append to existing file > Ok
یا از دستور زیر استفاده کنید:
log using C:\Users\HP\Desktop\Results_3, append |
شما باید مسیر فایل را مشخص کنید، در غیر این صورت دستور اجرا نخواهد شد.
اگر میخواهید محتویات یک فایل لاگ را با خروجیهای یک تحلیل جدید جایگزین کنید (مثلاً "Results_3.smcl")، از دستور زیر استفاده کنید:
log using C:\Users\HP\Desktop\Results_3, replace |
این دستور تمام محتویات فایل لاگ قبلاً ذخیره شده را حذف کرده و خروجیهای جلسه تحلیل جدید را ذخیره میکند.
مرور خروجیهای Stata در پنجره نتایج
شما میتوانید خروجیهای تحلیلها را در پنجره نتایج با استفاده از موس یا دکمههای صفحه کلید (<Shift+Page Up> یا <Shift+Arrow>) مرور کنید.
Stata به طور معمول (پیشفرض) هر بار که پنجره نتایج از اطلاعات پر میشود، توقف میکند مگر اینکه شما کلیدی را روی صفحه کلید فشار دهید. ما میتوانیم از Stata بخواهیم که به صورت پیوسته ادامه دهد (یعنی خروجیها را بدون توقف ارائه دهد) تا زمانی که خروجیها کامل شوند با استفاده از دستور زیر:
set more off |
برای برگشت به حالت توقف، از دستور زیر استفاده کنید:
set more on |
کپی جداول از خروجیهای Stata به MS Word
شما میتوانید یک جدول (یا دستورات یا اطلاعات دیگر) را از پنجره خروجیهای Stata (نتایج) به MS Word کپی کنید. برای انجام این کار:
- جدول را از پنجره خروجی با کشیدن موس انتخاب کنید.
- روی موس کلیک راست کرده و گزینه "کپی" را انتخاب کنید.
- به فایل MS Word بروید جایی که میخواهید جدول را پیست کنید.
- روی موس کلیک راست کرده و گزینه "چسباندن" (Paste) را انتخاب کنید.
تبدیل فرمت فایل لاگ از smcl به فرمت ASCII
شما میتوانید یک فایل لاگ Stata را از فرمت smcl (.smcl) به فرمت ASCII (.log) تبدیل کنید (و بالعکس). فرض کنید که میخواهید فایل لاگ "Results_3.smcl" واقع در دسکتاپ خود را به "Results_3.log" تبدیل کنید. از دستور یا مراحل زیر استفاده کنید:
دستور زیر:
translate C:\Users\HP\Desktop\Results_3.smcl C:\Users\HP\Desktop\Results_3.log |
یا:
از منوی File > Log > Translate > فایل "Results_3.smcl" را از دسکتاپ با کلیک روی تب "Browse" بخش "Input File" انتخاب کنید > Open > روی تب "Browse" بخش "Output File" کلیک کرده و نام فایل "Results_3.log" را وارد کنید > Save > Translate
فایل Do-file یا فایل دستورات Stata
ایجاد یک Do-file
شما میتوانید یک فایل Do-file ایجاد کرده و دستورات را در ویرایشگر Do-file برای استفادههای بعدی بنویسید. برای باز کردن ویرایشگر Do-file (یک فایل Do-file جدید)، از مراحل یا دستور زیر استفاده کنید:
Window > Do-file Editor > New Do-file Editor
یا از دستور زیر استفاده کنید:
doedit |
یا روی آیکون کلیک کنید.
دستور بالا برای باز کردن یک فایل Do-file جدید است. شما میتوانید فایل Do-file را همانند ذخیرهسازی یک فایل در MS Word ذخیره کنید:
File (در ویرایشگر Do-file) > Save as > انتخاب مکان و نام فایل > Save
برای باز کردن یک فایل Do-file ذخیره شده (مثلاً برای باز کردن فایل Do-file به نام “Test.do”)، از هر یک از دستورات زیر استفاده کنید. شما باید مسیر فایل و نام فایل را برای باز کردن فایل Do-file مشخص کنید، در غیر این صورت دستور کار نخواهد کرد.
doedit Test.do |
یا
doedit C:\Users\HP\Desktop\Test.do |
این دستور فایل Do-file به نام "Test.do" را که در دسکتاپ ذخیره شده است باز میکند. روش جایگزین این است که:
روی آیکون کلیک کنید، سپس
File (در ویرایشگر Do-file) > Open > File… ctrl+O > به مکان فایل بروید و فایل را انتخاب کنید > Open
تمام دستورات باید با حروف کوچک در فایل Do-file نوشته شوند. هنگام نوشتن دستورات، Stata پایان هر خط دستور را به عنوان پایان آن دستور در نظر میگیرد. اگر دستور شما از یک خط فراتر برود، از سه علامت بکاسلش (///) در انتهای خط استفاده کنید قبل از اینکه به خط بعدی ادامه دهید. سپس Stata در نظر میگیرد که دستور به خط بعدی ادامه دارد.
پس از ایجاد یک فایل جدید Do-file، میتوانید دستورات را از پنجره Review در Stata کپی کرده و در فایل Do-file بچسبانید.
ذخیرهسازی دستورات در یک فایل Do-file
فرض کنید که از برخی دستورات برای تحلیل دادههای خود استفاده کردهاید. شما میتوانید این دستورات را در پنجره Review مشاهده کنید. اگر میخواهید دستورات در پنجره Review را در یک فایل Do-file ذخیره کنید، مراحل زیر را دنبال کنید:
- دستور(ها)یی که میخواهید کپی کنید را انتخاب کنید
- روی دکمه راست موس کلیک کنید
- گزینه Send to Do-file Editor را انتخاب کنید (این کار بهطور خودکار یک فایل Do-file با دستورات انتخابشده در آن باز خواهد کرد)
- فایل را ذخیره کنید (File > Save as…)
شما خواهید دید که تمام دستورات انتخابشده در یک پنجره جداگانه (Do-file Editor) قرار دارند. شما میتوانید دستورات را در این فایل ویرایش کرده و فایل را برای اجرای بعدی ذخیره کنید. دستورات همچنین میتوانند از پنجره Review، پنجره Results یا فایل log با استفاده از گزینههای "Copy" و "Paste" به یک فایل Do-file کپی و چسبانده شوند.
اجرای دستورات در یک فایل Do-file
اجرای دستورات ذخیرهشده در یک فایل Do-file ساده است. ابتدا، فایل Do-file را در Do-file Editor باز کنید (بخش 3.1.3.1) که شامل دستورات مورد نظر شما برای اجرا است. برای اجرای یک دستور منفرد یا چند دستور متصل در یک زمان که در فایل Do-file نوشته شده است، مراحل زیر را دنبال کنید:
دستور(ها)یی که میخواهید اجرا کنید را با استفاده از موس انتخاب کنید
Tools > Execute (Do) را انتخاب کنید، یا روی آیکون در Do-file Editor کلیک کنید
این دستورها دستورات انتخابشده در فایل Do-file را اجرا خواهند کرد. اگر از مراحل زیر بدون انتخاب هیچ دستور در فایل Do-file (پس از باز کردن فایل Do-file در ویرایشگر Do-file) استفاده کنید، Stata تمام دستورات ذخیرهشده در فایل Do-file را اجرا خواهد کرد.
Tools > Execute (do)
برای اجرای تمام دستورات در یک فایل Do-file (مثلاً فایل Do-file “Test.do” که در دسکتاپ ذخیره شده است)، از دستور زیر استفاده کنید:
do C:\Users\HP\Desktop\Test.do |
این دستور تمام دستورات ذخیرهشده در فایل Do-file “Test.do” را بدون باز کردن فایل Do-file در ویرایشگر Do-file اجرا خواهد کرد.
دستور زبان پایه
بیشتر محققان به دلیل سادگی و راحتی استفاده از دستورات Stata برای تحلیل دادهها استفاده میکنند. یک فرم معمول از دستور زبان دستورات Stata به صورت زیر است:
command [varlist] [if exp] [in] [weight] [, options] |
یا
[prefix:] command [varlist] [if exp] [in] [weight] [, options] |
command: دستور Stata برای تحلیل دادهها را نشان میدهد. این دستور به ما میگوید که Stata چه چیزی را تحلیل خواهد کرد. دستورات Stata حساس به حروف بزرگ و کوچک هستند. همه دستورات باید با حروف کوچک نوشته شوند، در غیر این صورت کار نخواهند کرد.
varlist: "varlist" به معنای "لیست متغیرها" است. این لیست نشاندهنده مجموعه متغیرهایی است که برای اجرای دستور به آنها نیاز است. در بسیاری از دستورات، لیست متغیرها اختیاری است. اگر "varlist" مشخص نشود، دستور روی تمام متغیرهای موجود در مجموعه دادهها اجرا خواهد شد. برای مثال، اگر دستور زیر را استفاده کنید:
summarize age |
Stata آمار خلاصه متغیر "age" را نمایش میدهد. اگر فقط دستور "summarize" را بدون نام متغیر بنویسید، Stata آمار خلاصه تمام متغیرهای موجود در مجموعه دادهها را نمایش خواهد داد. به جای نوشتن کامل دستور "summarize"، میتوانید فقط از سه حرف اول آن استفاده کنید، مانند "sum" برای دریافت آمار خلاصه.
if exp: "if exp" به معنای "اگر عبارت" است. این بخش شرایطی را که باید در حین تحلیل مد نظر قرار گیرند مشخص میکند. این بخش اختیاری است. به عنوان مثال، اگر بخواهید آمار خلاصه متغیر "age" را فقط برای مردان دریافت کنید (فرض کنید که مردان با 1 در متغیر "sex" کدگذاری شدهاند)، از دستور زیر استفاده کنید:
sum age if sex==1 |
in: "in" محدودیتهای دامنه را از نظر شمارههای مشاهدهها نشان میدهد. این بخش اختیاری است. برای مثال، اگر بخواهید ۱۰ مقدار اول یا آخر از متغیر "age" را در مجموعه دادهها لیست کنید، از دستورهای زیر استفاده کنید:
list age in 1/10 |
list age in -10/-1 |
دستور اول ۱۰ مقدار اول را لیست میکند (۱/۱۰ نشاندهنده ۱ تا ۱۰ است)، در حالی که دستور دوم ۱۰ مقدار آخر متغیر "age" را نمایش میدهد.
[ ]: تمام دستورهای داخل [ ] اختیاری هستند. ممکن است شما نیازی به انتخاب هیچ چیزی نداشته باشید. برای مثال، شما میتوانید دستور زیر را استفاده کنید (بدون استفاده از "if"، "in" و "weight") برای دریافت آمار خلاصه برای متغیر age:
sum age |
weight: "weight" به معنای "متغیر وزن" است. اگر متغیر وزنی (وزن فراوانی یا وزن نمونهبرداری) وجود دارد که میخواهید در تحلیل وارد کنید، آن را بعد از "in" قرار دهید. برای مثال:
sum age [fweight = v2] |
در اینجا، "fweight" نشاندهنده وزن فراوانی است ("pweight" نشاندهنده وزن نمونهبرداری) و "v2" متغیر وزنی است که میخواهید در نظر بگیرید.
options: "options" دستورات اختیاری برای تحلیل دادهها را نشان میدهند. توجه داشته باشید که قبل از گزینهها، باید از کاما (،) استفاده شود. برای مثال:
sum age, detail |
در اینجا، ما از گزینه "detail" استفاده کردهایم. هنگامی که این گزینه (detail) را استفاده میکنیم، Stata آمار خلاصه دقیق (میانگین، انحراف معیار، کشیدگی، کرتوژی، درصدها و دیگر آمارها) را برای متغیر نمایش میدهد.
prefix: "prefix" برای تحلیل الزامی نیست. پیشوند برای گرفتن نتایج از زیرگروهها استفاده میشود، مانند بر اساس جنسیت، شغل یا سایر متغیرها. برای مثال، اگر بخواهید آمار خلاصه سن را بر اساس جنسیت دریافت کنید (یعنی بر اساس مردان و زنان)، پیشوند نیاز است. سپس دستورات به صورت زیر خواهند بود:
sort sex |
by sex: sum age |
یا
bysort sex: sum age |
یا
By sex, sort: sum age |
در اینجا، "by sex"، "bysort sex" و "by sex, sort" پیشوندها هستند، در حالی که "sum" دستور اصلی برای دریافت آمار خلاصه سن است. ما از دستور "sort sex" برای مرتبسازی (به ترتیب صعودی) متغیر "sex" استفاده کردهایم. Stata برای اجرای دستور اصلی "sum" نیاز به مرتبسازی (به ترتیب صعودی) متغیر پیشوندی (در این مثال، sex) دارد. به همین دلیل، ما از دستور اول، "sort sex" استفاده کردیم. اما میتوانید از یک دستور واحد مانند "bysort sex" استفاده کنید که ابتدا متغیر "by" (در اینجا sex) را مرتبسازی کرده و سپس دستور اصلی را اجرا میکند.
معرفی و آموزش نرم افزار (2)stata.
۲.۱ تولید فایلهای داده
۲.۱.۱ تولید فایل داده با تایپ دادهها در ویرایشگر داده
برای تولید یک فایل داده، اولین و اصلیترین قدم تصمیمگیری در مورد نام هر یک از متغیرهای موجود در پرسشنامه یا برگه ثبت است. برای نامگذاری یک متغیر، باید از قوانین خاصی پیروی کنیم. این قوانین عبارتند از:
نامهای متغیر باید منحصر به فرد باشند (یعنی همه متغیرها باید نامهای متفاوتی داشته باشند).
نام یک متغیر باید بین ۱ تا ۳۲ کاراکتر باشد. اما سعی کنید آن را کوتاه نگه دارید.
نامهای متغیر باید با یک حرف (کوچک یا بزرگ) یا یک زیرخط شروع شوند. نامهای متغیر نمیتوانند با یک عدد شروع شوند. اگرچه میتوان از زیرخط برای شروع نام متغیر استفاده کرد، اما این کار به شدت توصیه نمیشود زیرا چنین نامهای متغیری در Stata برای نشان دادن متغیرهای موقتی استفاده میشوند.
متغیرها نمیتوانند شامل نقطه (.)، فضا (کاراکتر خالی فاصله) یا نمادهایی مانند ؟، *، µ، λ، ~، !، -، @ و # باشند.
Stata حساس به حروف بزرگ و کوچک است. برای مثال، "Gender"، "gender" و "GENDER" در Stata بهعنوان یک متغیر در نظر گرفته نمیشوند. هنگام تحلیل، باید نامهای متغیرها را به درستی تایپ کنید تا دستورها اجرا شوند. ما توصیه میکنیم از نامهای متغیر با تمام حروف کوچک استفاده کنید (مثلاً gender).
پس از تصمیمگیری در مورد نامهای متغیرها، گام بعدی تولید یک فایل داده است. در Stata، برای تولید یک فایل داده، ابتدا دادهها را وارد میکنیم سپس نامهای متغیر را وارد میکنیم. فرض کنید که دادهها را با استفاده از یک پرسشنامه پیشکد شده جمعآوری کردهایم (کدها در پرانتز نشان داده شدهاند) با متغیرهای زیر:
متغیرهای طبقهبندیشده:
- جنسیت (m= مرد؛ f= زن)
- مذهب (1= اسلام/مسلمان؛ 2= هندو؛ 3= دیگر)
- شغل (1= کسبوکار؛ 2= شغل دولتی؛ 3= شغل خصوصی؛ 4= دیگر)
- وضعیت تأهل (1= متاهل؛ 2= مجرد؛ 3= دیگر)
- دیابت (1= بله؛ 2= خیر)
متغیرهای کمّی (عدد عددی):
- شماره شناسایی
- سن پاسخدهنده
- درآمد ماهانه خانواده
- فشار خون سیستولیک (BP)
- فشار خون دیاستولیک (BP)
فرض کنید که تصمیم گرفتهایم از "age" بهعنوان نام متغیر برای سن، "sex" برای جنسیت، و "religion" برای مذهب استفاده کنیم. به جای age، sex و religion، میتوانید از هر نام دیگری برای متغیرها استفاده کنید، مانند v1، v2، و v3. همیشه راحت است که یک کتابچه کد در MS Word یا MS Excel تهیه کنید که در آن نامهای متغیرهای Stata، نامهای واقعی متغیرها (برچسبهای متغیر) و کدهای متغیرها (برچسبهای مقادیر) ثبت شود (جدول ۲.۱). کتابچه کد هنگام تحلیل دادهها مفید است.
استفاده از متغیرهای عددی به جای متغیرهای رشتهای (کاراکتری) برای یک فایل داده راحتتر است. متغیرهای عددی کدهای عددی دارند (مثلاً ۱= مرد؛ ۲= زن). متغیرهای رشتهای ممکن است کدگذاری شده یا نشده باشند. اگر یک متغیر رشتهای کدگذاری شده باشد، با حروف کدگذاری میشود (مثلاً m= مرد؛ f= زن). هنگامی که یک متغیر رشتهای کدگذاری نشده باشد، دادهها مستقیماً در فایل داده وارد میشوند. بهعنوان مثال، دادههای جنسیت (مرد/زن)، مذهب (اسلام/هندو/دیگر) و شغل (کسبوکار/دارنده شغل/دیگر) ممکن است مستقیماً در فایل داده وارد شوند. توجه داشته باشید که Stata اجازه نمیدهد برای متغیرهای رشتهای کدگذاریشده (مثلاً m= مرد؛ f= زن) برچسب مقدار اعمال شود.
جدول ۲.۲ برخی از دادهها (بهعنوان مثال) را نشان میدهد که با استفاده از پرسشنامه (جدول ۲.۱) جمعآوری شدهاند. ما از این دادهها برای تولید یک فایل داده در Stata استفاده خواهیم کرد.
جدول 2.1 کتاب کدهای پرسشنامه
نام متغیر در Stata | نام واقعی متغیر / برچسب متغیر | کد متغیر / برچسبهای مقدار |
idno | شماره شناسایی | مقدار واقعی |
age | سن به سال | مقدار واقعی |
sex | جنسیت* | m= مرد، f= زن |
religion | مذهب | 1= اسلام/مسلمان، 2= هندو، 3= دیگر |
occu | شغل | 1= کسبوکار، 2= شغل دولتی، 3= شغل خصوصی، 4= دیگر |
income | درآمد ماهانه خانواده به تاکا | مقدار واقعی |
marital | وضعیت تأهل | 1= متاهل، 2= مجرد، 3= دیگر |
diabetes | دیابت شیرین | 1= بله، 2= خیر |
sbp | فشار خون سیستولیک به میلیمتر جیوه | مقدار واقعی |
dbp | فشار خون دیاستولیک به میلیمتر جیوه | مقدار واقعی |
جدول 2.2 داده های جمع آوری شده از افراد مورد مطالعه (فقط بخشی نشان داده شده است)
idno | age | sex | religion | occu | income | marital |
1 | 26 | m | 1 | 2 | 25000 | 1 |
2 | 28 | f | 2 | 2 | 35000 | 1 |
3 | 29 | f | 1 | 1 | 60000 | 1 |
4 | 34 | m | 1 | 3 | 20000 | 2 |
این دادهها شامل متغیرهای شناسه (idno)، سن (age)، جنسیت (sex)، مذهب (religion)، شغل (occu)، درآمد (income) و وضعیت تأهل (marital) هستند.
برای باز کردن برنامه Stata، روی آیکون Stata دوبار کلیک کنید. شما رابط کاربری Stata (Stata/SE 13.0) را مشاهده خواهید کرد که در شکل 1.1 فصل اول نشان داده شده است. سادهترین روش برای تولید یک فایل داده از طریق ویرایشگر دادهها است. برای دسترسی به ویرایشگر داده، از نوار منو انتخاب کنید:
پنجره > ویرایشگر داده
یا
داده > ویرایشگر داده > ویرایشگر داده (ویرایش)
یا
روی آیکون در نوار ابزار کلیک کنید.
شما "ویرایشگر داده (ویرایش) – بدون عنوان" را مشاهده خواهید کرد که در شکل 2.1 نشان داده شده است. این پنجره برای تعریف متغیرها و همچنین وارد کردن دادهها استفاده میشود. برای ایجاد یک فایل داده مراحل زیر را دنبال کنید:
مرحله 1: اولین متغیر ما "idno" است (جدول 2.2). وقتی نشانگر موس در اولین ستون ردیف اول قرار گیرد، در کادر بالای صفحه "var1[1]" نمایش داده میشود. اولین مقدار متغیر "idno" را مطابق با جدول 2.2 وارد کنید (که عدد 1 است، یعنی فقط 1 را تایپ کنید و دکمه "Enter" را فشار دهید). خواهید دید که "var1" در بالای اولین ستون ظاهر میشود (شکل 2.2).
حالا مقدار متغیر دوم "age" (که 26 است) را در اولین خانه از ستون دوم وارد کنید و "Enter" را فشار دهید. خواهید دید که "var2" در بالای ستون دوم ظاهر میشود. به همین ترتیب، مقادیر سایر متغیرها را در صفحهگسترده ویرایشگر داده Stata وارد کنید.
اگر اولین مقداری که برای یک متغیر وارد میشود عدد باشد، Stata آن را بهعنوان یک متغیر عددی در نظر میگیرد و بهطور خودکار فقط اعداد را بهعنوان مقادیر آن متغیر میپذیرد. مقادیر عددی ممکن است با علامت مثبت یا منفی شروع شوند و شامل اعشار باشند. اما اعداد نباید شامل کاما (,) باشند، مانند 10,000 یا 1,000,000.
اگر اولین مقداری که برای یک متغیر وارد میشود یک کاراکتر غیر عددی (مانند m، f یا هر حرف دیگری) باشد، Stata آن را بهعنوان یک متغیر رشتهای (متنی) در نظر میگیرد. یک متغیر رشتهای میتواند مقادیری به طول حداکثر 244 کاراکتر داشته باشد و میتواند ترکیبی از حروف، اعداد، نمادها و فضاها باشد.
شکل 2.1 صفحه گسترده ویرایشگر داده Stata
شکل 2.2 ویرایشگر داده Stata با نام متغیرها
در ویرایشگر دادهها (Data Editor) یا مرورگر دادهها (Data Browser)، مقادیر متغیرهای رشتهای به رنگ قرمز، مقادیر متغیرهای عددی به رنگ سیاه و مقادیر متغیرهای عددی با برچسب (کدگذاری شده) به رنگ آبی نمایش داده میشوند.
مرحله 2: در این مرحله، نامهای متغیرهایی که به طور خودکار توسط Stata تولید شدهاند (مانند var1، var2 و var3) را با نامهای متغیر که در دفترچه کد (Codebook) آمده است (مانند idno، age و ...) جایگزین خواهیم کرد. برای مثال، باید متغیر اول "var1" را به "idno"، متغیر دوم "var2" را به "age" و به همین ترتیب تغییر نام دهیم.
در پنجره ویرایشگر دادهها، سه پنجره به نامهای "Variables"، "Properties" و "Data" وجود دارند. در پنجره "Variables"، نامهای متغیرهایی که به طور خودکار ایجاد شدهاند (مانند var1، var2 و var3) نمایش داده میشوند. بر روی "var1" در پنجره "Variables" کلیک کنید و در پنجره "Properties" خواهید دید که نام "var1" مقابل "Name" قرار دارد. دو بار روی "Name" در پنجره "Properties" کلیک کرده، "var1" را حذف کرده و "idno" را تایپ کنید. این کار "var1" را با "idno" جایگزین خواهد کرد. اکنون میتوانید نام جدید متغیر (idno) را هم در صفحه گسترده (spreadsheet) و هم در پنجره "Variables" مشاهده کنید. به همین صورت، تمام متغیرهای تولید شده خودکار توسط Stata را با نامهای دلخواه خود جایگزین کنید.
همچنین میتوانید از دستور زیر برای تغییر نام متغیر استفاده کنید:
rename var1 idno |
این دستور، متغیر "var1" را به "idno" تغییر نام میدهد.
مرحله 3: اکنون برچسب متغیرها را یکی یکی وارد خواهیم کرد. برای نوشتن برچسب متغیر برای "idno"، روی متغیر "idno" در پنجره "Variables" کلیک کنید و دو بار روی "Label" در پنجره "Properties" کلیک کرده، "serial no" را تایپ کنید. این کار برچسب متغیر "idno" را به "serial no" تغییر خواهد داد. به همین ترتیب، تمام برچسبهای متغیرها را مطابق دفترچه کد تکمیل کنید. راه دیگری برای برچسبگذاری یک متغیر استفاده از دستور زیر در پنجره دستورات (Command window) است:
label var idno "serial no" |
این دستور، متغیر "idno" را به "serial no" برچسبگذاری میکند.
مرحله 4: در این مرحله، برچسبهای مقادیری را که به متغیرها اختصاص داده شده است، تعیین خواهیم کرد. از آنجا که متغیرهای "idno" و "age" متغیرهای دستهبندیشده نیستند (یعنی این متغیرها کدگذاری نشدهاند)، نیازی به برچسب مقادیر ندارند. برچسب مقادیر فقط برای متغیرهای دستهبندیشده که به صورت عددی کدگذاری شدهاند، لازم است. Stata برچسب مقادیر را برای متغیرهای رشتهای نمیپذیرد. بنابراین، باید برچسبهای مقادیر را فقط برای متغیرهای عددی کدگذاری شده مانند "religion"، "occupation" و دیگر متغیرهای مشابه اختصاص دهیم.
برای اختصاص برچسب مقادیر به متغیر "religion"، میتوانید از دستور زیر استفاده کنید یا مراحل زیر را دنبال کنید:
label define religion 1 "Muslim" 2 "Hindu" 3 "Others" |
یا به سادگی:
la de religion 1 "Muslim" 2 "Hindu" 3 "Others" |
یا این مراحل را دنبال کنید:
در پنجره "Variables" در ویرایشگر دادهها، متغیر "religion" را انتخاب کنید.
روی "Value Label" در پنجره "Properties" کلیک کنید.
یک پیکان کشویی و یک جعبه کوچک با 3 نقطه مشاهده خواهید کرد.
روی جعبه سه نقطه کلیک کنید.
روی "Create Label" کلیک کنید.
"religion" را در جعبه "Label name" بنویسید.
1 را در جعبه "Value" بنویسید، "Muslim" را در جعبه "Label" نوشته و "Add" را کلیک کنید.
2 را در جعبه "Value" بنویسید، "Hindu" را در جعبه "Label" نوشته و "Add" را کلیک کنید.
3 را در جعبه "Value" بنویسید، "Others" را در جعبه "Label" نوشته و "Add" را کلیک کنید.
روی "OK" و سپس "Close" کلیک کنید.
در پنجره "Properties"، روی "Value Label" کلیک کرده و از پیکان کشویی "religion" را انتخاب کنید.
با انجام این مراحل یا استفاده از دستور، برچسبهای مقادیر را برای متغیر "religion" و سایر متغیرهای کدگذاریشده در فایل دادهها وارد کنید و دادهها را یکی یکی وارد نمایید.
مرحله 5: پس از تکمیل ورود دادهها (یا به صورت جزئی)، باید فایل دادهها را ذخیره کنید. برای ذخیره فایل دادهها، از منوی بالا گزینه زیر را انتخاب کنید:
File > Save As… > انتخاب پوشه > نام فایل را وارد کنید (.dta به صورت پیشفرض خواهد آمد) > ذخیره
یا از دستور "save" استفاده کنید:
save "C:\Users\HP\Desktop\practice.dta" |
اگر میخواهید فایل دادهها را با همان نام ذخیره کنید، از دستور زیر استفاده کنید:
save, replace |
این دستور، فایل دادهها را با همان نام و در همان محل ذخیره میکند. گزینه replace در دستور فایل قدیمی را با همان نام جایگزین میکند.
دستوراتی برای تغییر نام، برچسبگذاری و تخصیص برچسب مقادیر:
برای تغییر نام متغیر:
rename var1 idno |
برای برچسبگذاری متغیر:
label var idno "serial no." |
برای تخصیص برچسب مقادیر به متغیر:
label define religion 1 "Muslim" 2 "Hindu" 3 "Others" |
label values religion religion |
برای تغییر برچسبهای مقادیر:
label define religion 1 "Muslim" 2 "Hindu" 3 "Christian", replace |
برای مخفی کردن برچسب مقادیر در ویرایشگر دادهها:
Tools > Value Labels > Hide All Value Labels
یا از دستور:
Browse, nolabel |
ایجاد فایل دادهای با استفاده از دستورات کپی و پیست
سادهترین روش برای ایجاد یک فایل دادهای در Stata، کپی و پیست دادهها از یک فایل داده دیگر است، به عنوان مثال از Excel، dBase، SPSS یا دیگر برنامهها. برای مثال، فرض کنید که شما یک فایل دادهای در SPSS، Excel یا برنامهای دیگر دارید. شما میتوانید تمام دادهها را از این فایلها به Stata وارد کنید. برای این کار، پنجره "Data Editor" را در Stata باز کنید (از منوی Window > Data Editor). به فایل دادهای که میخواهید دادهها را از آن کپی کنید بروید. دادههایی که میخواهید وارد کنید را انتخاب کرده و کپی کنید (Control-C) و سپس آنها را در صفحه گسترده پنجره "Data Editor" در Stata پیست کنید (Control-V). Stata به طور خودکار نام متغیرها را به عنوان var1، var2 و var3 و غیره ارائه میدهد. نام متغیرها (مانند var1، var2، var3 و دیگران) را به نامهای دلخواه خود تغییر دهید. همچنین برچسبهای متغیر و برچسبهای مقادیر را طبق آنچه که در بخش 2.1.1 گفته شد وارد کنید. در نهایت، فایل دادهها را در مکان مورد نظر خود ذخیره کنید (File > Save as > …). این روش برای مجموعه دادههای کوچک با تعداد کمی از متغیرها مناسب است.
وارد کردن فایل دادهای از برنامههای دیگر
نسخه 16 و بالاتر Stata گزینهای برای وارد کردن مستقیم دادههای SPSS به Stata دارد، با استفاده از منوی کشویی [File > Import > SPSS data (*.sav)]. نسخههای پایینتر این گزینه را ندارند. با این حال، بهترین روش برای وارد کردن فایل دادهای SPSS به Stata این است که ابتدا فایل دادهای را در SPSS به فرمت Stata ذخیره کنید.
برای مثال، اگر میخواهید فایل دادهای SPSS به نام "wealth.sav" را به "wealth.dta" در فرمت Stata تبدیل کنید، ابتدا فایل داده را در SPSS باز کنید. سپس مراحل زیر را دنبال کنید: File > Save as… > از منوی کشویی "Save as type"، Stata Version 13 SE (*.dta) را انتخاب کنید > نام "wealth" را در جعبه نام فایل وارد کنید > Save.
این کار فایل دادهای SPSS "wealth" را به فرمت Stata تبدیل و ذخیره میکند. همچنین میتوانید از برنامههای تبدیل داده مناسب برای وارد کردن دادهها از SPSS یا دیگر فرمتها به فرمت Stata استفاده کنید.
حذف و وارد کردن متغیرها
حذف یک متغیر
شما میتوانید متغیرهای ناخواسته را از فایل داده حذف کنید. برای حذف یک متغیر، مراحل زیر را دنبال کنید:
یک متغیر را در پنجره "Variables" در Stata انتخاب کنید.
روی آن راست کلیک کرده و گزینه "Drop selected variables" را انتخاب کنید.
همچنین میتوانید از دستور "drop" برای حذف یک متغیر استفاده کنید. برای مثال، اگر بخواهید متغیر "sex" را از فایل داده حذف کنید، از دستور زیر استفاده کنید:
drop sex |
وارد کردن یک متغیر جدید
شما نمیتوانید یک متغیر جدید را در فایل داده وارد کنید مگر اینکه مقداری (یا مقدار گمشده) برای آن متغیر انتخاب کنید. برای مثال، اگر بخواهید یک متغیر جدید به نام "gender" وارد کنید که تمام مقادیر آن برابر با 1 باشد، از دستور زیر استفاده کنید:
generate gender=1 |
یا:
gen gender=1 |
اگر بخواهید متغیر "gender" را با مقادیر گمشده وارد کنید، از دستور زیر استفاده کنید:
gen gender=0 |
متغیر جدید به عنوان آخرین متغیر در فایل داده ظاهر خواهد شد. همچنین باید برچسب متغیر و برچسبهای مقادیر را برای متغیر جدید وارد کنید همانطور که قبلاً توضیح داده شد (بخش 2.1.1).
کپی کردن یک متغیر در همان فایل داده
شما ممکن است بخواهید یک متغیر را در همان فایل دادهای که در حال استفاده هستید کپی کنید. فرض کنید که میخواهید یک کپی از متغیر "religion" که در حال حاضر در مجموعه داده موجود است، ایجاد کنید. برای این کار، باید یک متغیر جدید ایجاد کنید زیرا فایل داده نمیتواند همان نام متغیر را به عنوان نسخه کپیاش بپذیرد. بیایید نام متغیر جدید را "religion2" بگذاریم. برای کپیکردن دقیق (کلون) متغیر "religion" از دستور زیر استفاده کنید:
clonevar religion2=religion |
همچنین میتوانید از دستور زیر استفاده کنید:
gen religion2=religion |
مزیت استفاده از دستور "clonevar" این است که برچسب متغیر و برچسب مقادیر را همانند متغیر قدیمی حفظ میکند، از جمله کد مقادیر گمشده. از طرف دیگر، اگر از دستور "gen" استفاده شود، برچسب متغیر و برچسب مقادیر در متغیر جدید حفظ نمیشود و باید به طور جداگانه وارد شوند.
معرفی و آموزش نرم افزار (1)stata.
این دستورالعمل بر تصمیمگیری آماری، تحلیل دادهها و تفسیر نتایج تمرکز دارد. تکنیکهای معمول تحلیل دادهها در پژوهشهای کمی را پوشش میدهد. موضوعات مطرحشده در این کتاب شامل مدیریت دادهها، آمار توصیفی، و تحلیلهای دو متغیره و چند متغیره برای آزمون فرضیهها است، از جمله روشهای ناپارامتریک و دیگر روشها.
نسخه
Stata بهطور مداوم در حال تکامل است. این بدین معناست که ممکن است دستورات، گزینهها، عناصر زبانی و دیگر موارد در نسخههای آینده تغییر کنند. با این حال، Stata اطمینان میدهد که نسخههای بالاتر دستورات را بدون توجه به نسخهای که دستورات در آن نوشته شدهاند، اجرا میکنند. بنابراین، انتظار میرود که تمام دستورات (نوشتار) استفادهشده در این کتاب در نسخههای بالاتر (یا پایینتر) اجرا شوند.
این کتاب بر اساس نسخه ۱۳ Stata نوشته شده است. اگر شما از نسخه متفاوتی (مثلاً نسخه ۱۷) استفاده میکنید، هنوز میتوانید از دستورات استفاده کنید. اگر مشکلی در اجرای دستوری که در این کتاب آمده در نسخه ۱۷ (یا نسخههای دیگر) پیدا کردید، دستور زیر را در ابتدای هر فایل Do (فصل ۳) که ایجاد میکنید تایپ کنید:
version 13
این گام ساده اطمینان میدهد که فایل Do یا برنامه شما نه تنها در نسخه ۱۷ بلکه در تمام نسخههای آینده Stata، حتی اگر آن نسخههای آینده تغییراتی در نوشتار برخی از دستورات یا ساختارهای برنامهنویسی داشته باشند، به درستی اجرا خواهد شد.
شما میتوانید از دستور بالا بهعنوان پیشوند هنگام نوشتن دستور در پنجره فرمان استفاده کنید. بهعنوان مثال، اگر میخواهید دستور ANOVA را در نسخه ۱۷ که در نسخه ۱۳ نوشته شده است اجرا کنید، از دستور زیر استفاده کنید:
version 13: anova…..
این دستور نسخه Stata را به ۱۳ تنظیم میکند، دستور anova را اجرا میکند و سپس نسخه Stata را به حالت قبلی خود بازمیگرداند.
رابط کاربری Stata
پس از باز کردن Stata (با دوبار کلیک روی آیکون Stata)، رابط کاربری آن مشابه شکل ۱.۱ خواهد بود. این نرمافزار شش پنجره دارد که در شکل ۱.۱ با شمارههای ۱ تا ۶ نشان داده شدهاند. هدف هر پنجره در جدول ۱.۱ توضیح داده شده است. همچنین برخی از آیکونهای مفید در نوار ابزار Stata (شکل ۱.۲) وجود دارند که عملکرد آنها در جدول ۱.۲ آمده است. در فصلهای بعدی، Stata را بهطور دقیقتر بررسی خواهیم کرد.
مراحل تحلیل دادهها
ما برای پژوهشهای خود دادهها را با استفاده از ابزارها و روشهای مختلف جمعآوری میکنیم. رایجترین ابزارهای جمعآوری دادهها، پرسشنامهها و برگههای ثبت اطلاعات هستند، در حالی که رایجترین روشهای جمعآوری دادهها شامل مصاحبهها (حضوری، تلفنی یا آنلاین)، مشاهدات، معاینات بدنی و آزمایشهای آزمایشگاهی است. گاهی اوقات از دادههای موجود (دادههای ثانویه) برای مطالعات تحقیقاتی خود استفاده میکنیم، مانند سوابق بیمارستانی یا دادههای مربوط به پژوهشهای دیگر. پس از جمعآوری دادهها، مراحل تحلیل دادهها به شرح زیر است:
- کدگذاری دادهها، اگر از پرسشنامه یا برگه ثبت پیشکد شده استفاده نشده باشد
- ایجاد یک فایل داده و وارد کردن دادهها
- پاکسازی دادهها (بررسی خطاها در هنگام وارد کردن دادهها)
- غربالگری دادهها (بررسی مفروضات برای آزمونهای آماری)
- تحلیل دادهها
- تفسیر نتایج
شکل 1.1 محیط کاربری Stata در ویندوز
شکل 1.2 نمادهای نوار ابزار Stata
جدول 1.1 پنجرههای Stata و اهداف آنها
پنجره | هدف |
پنجره فرمان [1] | این پنجره برای نوشتن دستورات است. ما دستورات را در این پنجره مینویسیم. دستورات زمانی که کلید "Enter" فشرده شود اجرا میشوند. شما میتوانید از کلیدهای "Page Up" و "Page Down" روی کیبورد برای فراخوانی دستورات از پنجره "Review" (پنجره ۶) استفاده کنید. |
پنجره نتایج یا خروجیها [2] | این پنجره خروجیها را همراه با دستورات اجرا شده نمایش میدهد. همچنین اگر مشکلی در دستورات وجود داشته باشد، پیامهای خطا را نشان میدهد. پنجره نتایج حدود ۵۰۰ خط خروجی را نگه میدارد. هنگامی که این محدودیت تجاوز کند، Stata خروجیهای قبلی را حذف میکند. اگر میخواهید خروجیها را ذخیره کنید، باید یک فایل لاگ تولید کنید تا خروجیها ذخیره شوند. شما میتوانید نتایج را با استفاده از ماوس یا دکمههای <Shift+Page Up/PageDown یا Arrow> مرور کنید. |
پنجره متغیرها [3] | نامهای متغیرهای مجموعه دادهای که در حال حاضر در حافظه فعال است (یعنی در حال استفاده است) را نمایش میدهد. اگر روی یک متغیر در این پنجره دوبار کلیک کنید، آن متغیر در پنجره "Command" ظاهر خواهد شد. |
پنجره ویژگیها: پنجره متغیرها [4] | در زیر پنجره "Properties"، یک پنجره "Variables" (۴) و یک پنجره "Data" (۵) وجود دارد. پنجره "Variables" ویژگیهای متغیرها مانند نام متغیر، برچسب متغیر و غیره را نمایش میدهد. |
پنجره دادهها [5] | این پنجره نام فایل، مسیر، تعداد متغیرهای مجموعه داده و تعداد مشاهدات را نشان میدهد. |
پنجره مرور [6] | این پنجره دستورات قبلاً اجرا شده در طول یک جلسه تحلیل را نمایش میدهد. اگر روی یک دستور در این پنجره کلیک کنید، آن دستور در پنجره "Command" ظاهر شده و با فشردن کلید "Enter" اجرا میشود. اگر روی یک دستور در پنجره "Review" دوبار کلیک کنید، آن دستور بهطور مستقیم اجرا میشود و خروجیها را میتوان در پنجره "Results" مشاهده کرد. |
جدول 1.2 آیکونهای نوار ابزار Stata و عملکردهای آنها
آیکون | عملکرد |
برای باز کردن یک فایل داده از مکان مورد نظر. | |
برای ذخیره فایل داده. | |
برای ذخیره فایل لاگ (فایل نتایج یا خروجیها). شما میتوانید با استفاده از این آیکون، فایل لاگ را شروع، ببندید، معلق کنید یا از سر بگیرید. | |
این آیکون مربوط به ویرایشگر جدید Do-file است. Do-file برای نوشتن، ویرایش و ذخیره دستورات استفاده میشود. شما میتوانید یک فایل Do (فایل دستورات) ایجاد کرده و آن را با استفاده از این آیکون ویرایش کنید. | |
این آیکون برای رفتن به ویرایشگر دادهها (حالت ویرایش) است. در این حالت، شما میتوانید دادهها را در فایل داده ویرایش یا تغییر دهید. | |
این آیکون برای رفتن به ویرایشگر دادهها (حالت مرور) است. در این حالت، شما فقط میتوانید دادهها را مرور کرده و مشاهده کنید، ولی نمیتوانید آنها را تغییر دهید. | |
این آیکون برای رفتن به مدیر متغیرها است، جایی که شما میتوانید نامهای متغیرها، برچسبهای متغیرها و برچسبهای مقادیر را ویرایش (تغییر) کنید. |