پروپوزال نیوز

تز نیوز

پیپر نیوز

  فایل دستورات (Do-file): فایل دستورات در Stata به نام "Do-file" شناخته می‌شود و پسوند آن ".do" است. این فایل برای ذخیره مجموعه‌ای از دستورات برای تحلیل داده‌ها استفاده می‌شود. دستورات ذخیره شده در یک Do-file می‌توانند هر زمان که لازم باشد دوباره استفاده یا اجرا شوند. دستورات می‌توانند مستقیماً نوشته شوند و یا در یک Do-file ویرایش شوند برای تحلیل.

فایل داده‌ای

باز کردن (دریافت) یک فایل داده‌ای موجود

در بخش قبلی (بخش 2)، ما نحوه ایجاد یک فایل داده‌ای در Stata را بررسی کردیم. اگر شما قبلاً یک فایل داده‌ای Stata روی کامپیوتر خود ذخیره کرده‌اید، می‌توانید آن را به روش‌های مختلف باز کنید، مانند استفاده از منوی کشویی، نوشتن دستور یا استفاده از آیکون.

فرض کنید که شما یک فایل داده‌ای Stata به نام "Data_3.dta" روی کامپیوتر خود دارید و مکان آن C:\Users\HP\Desktop است. اگر بخواهید فایل داده‌ای را باز کنید، مراحل یا دستور زیر را دنبال کنید:

    از منوی File (در نوار منو) > Open > به دسکتاپ بروید و فایل داده‌ای "Data_3" را انتخاب کنید > Open

    یا از دستور زیر استفاده کنید:

C:\Users\HP\Desktop\Data_3, clear

    یا روی آیکون  کلیک کنید > به دسکتاپ بروید > "Data_3" را انتخاب کنید > Open

    یا روی فایل داده‌ای که می‌خواهید باز کنید دوبار کلیک کنید.

فایل خروجی یا فایل لاگ

هنگامی که شما داده‌ها را تحلیل می‌کنید، خروجی‌ها (نتایج) در پنجره نتایج Stata نمایش داده می‌شوند. خروجی‌ها به طور خودکار ذخیره نمی‌شوند و شما باید آن‌ها را در یک فایل ذخیره کنید. در Stata، فایل‌های خروجی "فایل‌های لاگ" نامیده می‌شوند. فایل‌های لاگ خروجی‌ها و دستورات را شامل می‌شوند، اما گراف‌ها را شامل نمی‌شوند. گراف‌هایی که در Stata تولید می‌شوند باید به طور جداگانه ذخیره شوند.

ذخیره خروجی‌ها در فایل لاگ

فایل لاگ می‌تواند در دو فرمت مختلف ذخیره شود:

    فرمت Stata (که به فرمت smcl هم معروف است): در این فرمت، فایل لاگ پسوند ".smcl" خواهد داشت. فایل‌های لاگ در فرمت Stata فرمت‌هایی که در پنجره نتایج می‌بینیم را حفظ می‌کنند و این فرمت پیش‌فرض است.

    فرمت ASCII: در فرمت ASCII (متن عادی)، فایل پسوند ".log" خواهد داشت.

ما معمولاً از فرمت Stata (فرمت smcl) برای ذخیره خروجی‌ها استفاده می‌کنیم. با این حال، فرمت "smcl" می‌تواند در صورت لزوم به فرمت "ASCII" تبدیل شود.

فرض کنید که شما می‌خواهید داده‌های خود را تحلیل کرده و خروجی‌ها را در فایلی به نام "Results_3" ذخیره کنید. برای ذخیره خروجی‌ها، در ابتدای تحلیل فایل لاگ را ایجاد کنید (شما همچنین می‌توانید فایل لاگ را در میانه تحلیل ایجاد کنید) با استفاده از گزینه‌های نوار منو یا دستور به شرح زیر:

    از منوی File (در نوار منو) > Log > Begin... > مکان ذخیره فایل را انتخاب کنید > نام "Results_3" را در جعبه "File name" وارد کنید > فرمت .smcl را انتخاب کنید (معمولاً پیش‌فرض) > Save

    یا از دستور زیر استفاده کنید:

log using C:\Users\HP\Desktop\Results_3

دستور بالا فایل لاگ با نام "Results_3.smcl" را در دسکتاپ باز/ایجاد می‌کند.

پس از باز شدن فایل لاگ، شما می‌توانید هر زمان که خواستید ذخیره خروجی‌ها را به طور موقت متوقف کنید (تعلیق کنید) با استفاده از مراحل یا دستور زیر:

    File > Log > Suspend

    یا از دستور زیر استفاده کنید:

log off

شما می‌توانید ذخیره خروجی‌ها را در هر نقطه از جلسه تحلیل خود از سر بگیرید با استفاده از مراحل یا دستور زیر:

    File > Log > Resume

    یا از دستور زیر استفاده کنید:

log on

فایل لاگ به طور خودکار در پایان جلسه تحلیل زمانی که از Stata خارج می‌شوید ذخیره و بسته می‌شود. با این حال، شما می‌توانید هر زمان که خواستید فایل لاگ را ذخیره و ببندید با استفاده از مراحل یا دستور زیر:

    File > Log > Close

    یا از دستور زیر استفاده کنید:

log close

باز کردن یک فایل لاگ موجود

برای باز کردن یک فایل لاگ موجود که قبلاً روی کامپیوتر شما ذخیره شده است (مثلاً شما می‌خواهید فایل "Results_3.smcl" را که در دسکتاپ ذخیره شده است باز کنید)، مراحل زیر را دنبال کنید:

    File > Log > View > Browse > فایل "Results_3" را از دسکتاپ انتخاب کنید > Open > Ok

اگر می‌خواهید نتایج تحلیل جدیدی را به فایل لاگ قبلاً ذخیره شده اضافه (ضمیمه) کنید (مثلاً "Results_3.smcl")، مراحل یا دستور زیر را دنبال کنید:

    File > Log > Begin > فایل "Results_3" را از دسکتاپ (یا از محلی که ذخیره شده است) انتخاب کنید > Save > Append to existing file > Ok

    یا از دستور زیر استفاده کنید:

log using C:\Users\HP\Desktop\Results_3, append

شما باید مسیر فایل را مشخص کنید، در غیر این صورت دستور اجرا نخواهد شد.

اگر می‌خواهید محتویات یک فایل لاگ را با خروجی‌های یک تحلیل جدید جایگزین کنید (مثلاً "Results_3.smcl")، از دستور زیر استفاده کنید:

log using C:\Users\HP\Desktop\Results_3, replace

این دستور تمام محتویات فایل لاگ قبلاً ذخیره شده را حذف کرده و خروجی‌های جلسه تحلیل جدید را ذخیره می‌کند.

مرور خروجی‌های Stata در پنجره نتایج

شما می‌توانید خروجی‌های تحلیل‌ها را در پنجره نتایج با استفاده از موس یا دکمه‌های صفحه کلید (<Shift+Page Up> یا <Shift+Arrow>) مرور کنید.

Stata به طور معمول (پیش‌فرض) هر بار که پنجره نتایج از اطلاعات پر می‌شود، توقف می‌کند مگر اینکه شما کلیدی را روی صفحه کلید فشار دهید. ما می‌توانیم از Stata بخواهیم که به صورت پیوسته ادامه دهد (یعنی خروجی‌ها را بدون توقف ارائه دهد) تا زمانی که خروجی‌ها کامل شوند با استفاده از دستور زیر:

set more off

برای برگشت به حالت توقف، از دستور زیر استفاده کنید:

set more on

کپی جداول از خروجی‌های Stata به MS Word

شما می‌توانید یک جدول (یا دستورات یا اطلاعات دیگر) را از پنجره خروجی‌های Stata (نتایج) به MS Word کپی کنید. برای انجام این کار:

  1. جدول را از پنجره خروجی با کشیدن موس انتخاب کنید.
  2. روی موس کلیک راست کرده و گزینه "کپی" را انتخاب کنید.
  3. به فایل MS Word بروید جایی که می‌خواهید جدول را پیست کنید.
  4. روی موس کلیک راست کرده و گزینه "چسباندن" (Paste) را انتخاب کنید.

تبدیل فرمت فایل لاگ از smcl به فرمت ASCII

شما می‌توانید یک فایل لاگ Stata را از فرمت smcl (.smcl) به فرمت ASCII (.log) تبدیل کنید (و بالعکس). فرض کنید که می‌خواهید فایل لاگ "Results_3.smcl" واقع در دسکتاپ خود را به "Results_3.log" تبدیل کنید. از دستور یا مراحل زیر استفاده کنید:

    دستور زیر:

translate C:\Users\HP\Desktop\Results_3.smcl C:\Users\HP\Desktop\Results_3.log

یا:

    از منوی File > Log > Translate > فایل "Results_3.smcl" را از دسکتاپ با کلیک روی تب "Browse" بخش "Input File" انتخاب کنید > Open > روی تب "Browse" بخش "Output File" کلیک کرده و نام فایل "Results_3.log" را وارد کنید > Save > Translate

فایل Do-file یا فایل دستورات Stata

ایجاد یک Do-file

شما می‌توانید یک فایل Do-file ایجاد کرده و دستورات را در ویرایشگر Do-file برای استفاده‌های بعدی بنویسید. برای باز کردن ویرایشگر Do-file (یک فایل Do-file جدید)، از مراحل یا دستور زیر استفاده کنید:

    Window > Do-file Editor > New Do-file Editor

    یا از دستور زیر استفاده کنید:

doedit

    یا روی آیکون  کلیک کنید.

دستور بالا برای باز کردن یک فایل Do-file جدید است. شما می‌توانید فایل Do-file را همانند ذخیره‌سازی یک فایل در MS Word ذخیره کنید:

    File (در ویرایشگر Do-file) > Save as > انتخاب مکان و نام فایل > Save

برای باز کردن یک فایل Do-file ذخیره شده (مثلاً برای باز کردن فایل Do-file به نام “Test.do”)، از هر یک از دستورات زیر استفاده کنید. شما باید مسیر فایل و نام فایل را برای باز کردن فایل Do-file مشخص کنید، در غیر این صورت دستور کار نخواهد کرد.

doedit Test.do

یا

doedit C:\Users\HP\Desktop\Test.do

این دستور فایل Do-file به نام "Test.do" را که در دسکتاپ ذخیره شده است باز می‌کند. روش جایگزین این است که:

    روی آیکون  کلیک کنید، سپس

File (در ویرایشگر Do-file) > Open > File… ctrl+O > به مکان فایل بروید و فایل را انتخاب کنید > Open

تمام دستورات باید با حروف کوچک در فایل Do-file نوشته شوند. هنگام نوشتن دستورات، Stata پایان هر خط دستور را به عنوان پایان آن دستور در نظر می‌گیرد. اگر دستور شما از یک خط فراتر برود، از سه علامت بک‌اسلش (///) در انتهای خط استفاده کنید قبل از اینکه به خط بعدی ادامه دهید. سپس Stata در نظر می‌گیرد که دستور به خط بعدی ادامه دارد.

پس از ایجاد یک فایل جدید Do-file، می‌توانید دستورات را از پنجره Review در Stata کپی کرده و در فایل Do-file بچسبانید.

ذخیره‌سازی دستورات در یک فایل Do-file

فرض کنید که از برخی دستورات برای تحلیل داده‌های خود استفاده کرده‌اید. شما می‌توانید این دستورات را در پنجره Review مشاهده کنید. اگر می‌خواهید دستورات در پنجره Review را در یک فایل Do-file ذخیره کنید، مراحل زیر را دنبال کنید:

  1. دستور(ها)یی که می‌خواهید کپی کنید را انتخاب کنید
  2. روی دکمه راست موس کلیک کنید
  3. گزینه Send to Do-file Editor را انتخاب کنید (این کار به‌طور خودکار یک فایل Do-file با دستورات انتخاب‌شده در آن باز خواهد کرد)
  4. فایل را ذخیره کنید (File > Save as)

شما خواهید دید که تمام دستورات انتخاب‌شده در یک پنجره جداگانه (Do-file Editor) قرار دارند. شما می‌توانید دستورات را در این فایل ویرایش کرده و فایل را برای اجرای بعدی ذخیره کنید. دستورات همچنین می‌توانند از پنجره Review، پنجره Results یا فایل log با استفاده از گزینه‌های "Copy" و "Paste" به یک فایل Do-file کپی و چسبانده شوند.

اجرای دستورات در یک فایل Do-file

اجرای دستورات ذخیره‌شده در یک فایل Do-file ساده است. ابتدا، فایل Do-file را در Do-file Editor باز کنید (بخش 3.1.3.1) که شامل دستورات مورد نظر شما برای اجرا است. برای اجرای یک دستور منفرد یا چند دستور متصل در یک زمان که در فایل Do-file نوشته شده است، مراحل زیر را دنبال کنید:

    دستور(ها)یی که می‌خواهید اجرا کنید را با استفاده از موس انتخاب کنید

    Tools > Execute (Do) را انتخاب کنید، یا روی آیکون  در Do-file Editor کلیک کنید

این دستورها دستورات انتخاب‌شده در فایل Do-file را اجرا خواهند کرد. اگر از مراحل زیر بدون انتخاب هیچ دستور در فایل Do-file (پس از باز کردن فایل Do-file در ویرایشگر Do-file) استفاده کنید، Stata تمام دستورات ذخیره‌شده در فایل Do-file را اجرا خواهد کرد.

Tools > Execute (do)

برای اجرای تمام دستورات در یک فایل Do-file (مثلاً فایل Do-file “Test.do” که در دسکتاپ ذخیره شده است)، از دستور زیر استفاده کنید:

do C:\Users\HP\Desktop\Test.do

این دستور تمام دستورات ذخیره‌شده در فایل Do-file “Test.do” را بدون باز کردن فایل Do-file در ویرایشگر Do-file اجرا خواهد کرد.

دستور زبان پایه

بیشتر محققان به دلیل سادگی و راحتی استفاده از دستورات Stata برای تحلیل داده‌ها استفاده می‌کنند. یک فرم معمول از دستور زبان دستورات Stata به صورت زیر است:

command [varlist] [if exp] [in] [weight] [, options]

یا

[prefix:] command [varlist] [if exp] [in] [weight] [, options]

    command: دستور Stata برای تحلیل داده‌ها را نشان می‌دهد. این دستور به ما می‌گوید که Stata چه چیزی را تحلیل خواهد کرد. دستورات Stata حساس به حروف بزرگ و کوچک هستند. همه دستورات باید با حروف کوچک نوشته شوند، در غیر این صورت کار نخواهند کرد.

    varlist: "varlist" به معنای "لیست متغیرها" است. این لیست نشان‌دهنده مجموعه متغیرهایی است که برای اجرای دستور به آن‌ها نیاز است. در بسیاری از دستورات، لیست متغیرها اختیاری است. اگر "varlist" مشخص نشود، دستور روی تمام متغیرهای موجود در مجموعه داده‌ها اجرا خواهد شد. برای مثال، اگر دستور زیر را استفاده کنید:

summarize age

Stata آمار خلاصه متغیر "age" را نمایش می‌دهد. اگر فقط دستور "summarize" را بدون نام متغیر بنویسید، Stata آمار خلاصه تمام متغیرهای موجود در مجموعه داده‌ها را نمایش خواهد داد. به جای نوشتن کامل دستور "summarize"، می‌توانید فقط از سه حرف اول آن استفاده کنید، مانند "sum" برای دریافت آمار خلاصه.

if exp: "if exp" به معنای "اگر عبارت" است. این بخش شرایطی را که باید در حین تحلیل مد نظر قرار گیرند مشخص می‌کند. این بخش اختیاری است. به عنوان مثال، اگر بخواهید آمار خلاصه متغیر "age" را فقط برای مردان دریافت کنید (فرض کنید که مردان با 1 در متغیر "sex" کدگذاری شده‌اند)، از دستور زیر استفاده کنید:

sum age if sex==1

in: "in" محدودیت‌های دامنه را از نظر شماره‌های مشاهده‌ها نشان می‌دهد. این بخش اختیاری است. برای مثال، اگر بخواهید ۱۰ مقدار اول یا آخر از متغیر "age" را در مجموعه داده‌ها لیست کنید، از دستورهای زیر استفاده کنید:

list age in 1/10
list age in -10/-1

دستور اول ۱۰ مقدار اول را لیست می‌کند (۱/۱۰ نشان‌دهنده ۱ تا ۱۰ است)، در حالی که دستور دوم ۱۰ مقدار آخر متغیر "age" را نمایش می‌دهد.

[ ]: تمام دستورهای داخل [ ] اختیاری هستند. ممکن است شما نیازی به انتخاب هیچ چیزی نداشته باشید. برای مثال، شما می‌توانید دستور زیر را استفاده کنید (بدون استفاده از "if"، "in" و "weight") برای دریافت آمار خلاصه برای متغیر age:

sum age

weight: "weight" به معنای "متغیر وزن" است. اگر متغیر وزنی (وزن فراوانی یا وزن نمونه‌برداری) وجود دارد که می‌خواهید در تحلیل وارد کنید، آن را بعد از "in" قرار دهید. برای مثال:

sum age [fweight = v2]

در اینجا، "fweight" نشان‌دهنده وزن فراوانی است ("pweight" نشان‌دهنده وزن نمونه‌برداری) و "v2" متغیر وزنی است که می‌خواهید در نظر بگیرید.

options: "options" دستورات اختیاری برای تحلیل داده‌ها را نشان می‌دهند. توجه داشته باشید که قبل از گزینه‌ها، باید از کاما (،) استفاده شود. برای مثال:

sum age, detail

در اینجا، ما از گزینه "detail" استفاده کرده‌ایم. هنگامی که این گزینه (detail) را استفاده می‌کنیم، Stata آمار خلاصه دقیق (میانگین، انحراف معیار، کشیدگی، کرتوژی، درصدها و دیگر آمارها) را برای متغیر نمایش می‌دهد.

prefix: "prefix" برای تحلیل الزامی نیست. پیشوند برای گرفتن نتایج از زیرگروه‌ها استفاده می‌شود، مانند بر اساس جنسیت، شغل یا سایر متغیرها. برای مثال، اگر بخواهید آمار خلاصه سن را بر اساس جنسیت دریافت کنید (یعنی بر اساس مردان و زنان)، پیشوند نیاز است. سپس دستورات به صورت زیر خواهند بود:

sort sex
by sex: sum age

یا

bysort sex: sum age

یا

By sex, sort: sum age

در اینجا، "by sex"، "bysort sex" و "by sex, sort" پیشوندها هستند، در حالی که "sum" دستور اصلی برای دریافت آمار خلاصه سن است. ما از دستور "sort sex" برای مرتب‌سازی (به ترتیب صعودی) متغیر "sex" استفاده کرده‌ایم. Stata برای اجرای دستور اصلی "sum" نیاز به مرتب‌سازی (به ترتیب صعودی) متغیر پیشوندی (در این مثال، sex) دارد. به همین دلیل، ما از دستور اول، "sort sex" استفاده کردیم. اما می‌توانید از یک دستور واحد مانند "bysort sex" استفاده کنید که ابتدا متغیر "by" (در اینجا sex) را مرتب‌سازی کرده و سپس دستور اصلی را اجرا می‌کند.

۲.۱ تولید فایل‌های داده

۲.۱.۱ تولید فایل داده با تایپ داده‌ها در ویرایشگر داده

برای تولید یک فایل داده، اولین و اصلی‌ترین قدم تصمیم‌گیری در مورد نام هر یک از متغیرهای موجود در پرسشنامه یا برگه ثبت است. برای نام‌گذاری یک متغیر، باید از قوانین خاصی پیروی کنیم. این قوانین عبارتند از:

نام‌های متغیر باید منحصر به فرد باشند (یعنی همه متغیرها باید نام‌های متفاوتی داشته باشند).

نام یک متغیر باید بین ۱ تا ۳۲ کاراکتر باشد. اما سعی کنید آن را کوتاه نگه دارید.

نام‌های متغیر باید با یک حرف (کوچک یا بزرگ) یا یک زیرخط شروع شوند. نام‌های متغیر نمی‌توانند با یک عدد شروع شوند. اگرچه می‌توان از زیرخط برای شروع نام متغیر استفاده کرد، اما این کار به شدت توصیه نمی‌شود زیرا چنین نام‌های متغیری در Stata برای نشان دادن متغیرهای موقتی استفاده می‌شوند.

متغیرها نمی‌توانند شامل نقطه (.)، فضا (کاراکتر خالی فاصله) یا نمادهایی مانند ؟، *، µ، λ، ~، !، -، @ و # باشند.

Stata حساس به حروف بزرگ و کوچک است. برای مثال، "Gender"، "gender" و "GENDER" در Stata به‌عنوان یک متغیر در نظر گرفته نمی‌شوند. هنگام تحلیل، باید نام‌های متغیرها را به درستی تایپ کنید تا دستورها اجرا شوند. ما توصیه می‌کنیم از نام‌های متغیر با تمام حروف کوچک استفاده کنید (مثلاً gender).

پس از تصمیم‌گیری در مورد نام‌های متغیرها، گام بعدی تولید یک فایل داده است. در Stata، برای تولید یک فایل داده، ابتدا داده‌ها را وارد می‌کنیم سپس نام‌های متغیر را وارد می‌کنیم. فرض کنید که داده‌ها را با استفاده از یک پرسشنامه پیش‌کد شده جمع‌آوری کرده‌ایم (کدها در پرانتز نشان داده شده‌اند) با متغیرهای زیر:

متغیرهای طبقه‌بندی‌شده:

  1. جنسیت (m= مرد؛ f= زن)
  2.  مذهب (1= اسلام/مسلمان؛ 2= هندو؛ 3= دیگر)
  3.  شغل (1= کسب‌وکار؛ 2= شغل دولتی؛ 3= شغل خصوصی؛ 4= دیگر)
  4.  وضعیت تأهل (1= متاهل؛ 2= مجرد؛ 3= دیگر)
  5. دیابت (1= بله؛ 2= خیر)

متغیرهای کمّی (عدد عددی):

  1. شماره شناسایی
  2. سن پاسخ‌دهنده
  3. درآمد ماهانه خانواده
  4. فشار خون سیستولیک (BP)
  5. فشار خون دیاستولیک (BP)

فرض کنید که تصمیم گرفته‌ایم از "age" به‌عنوان نام متغیر برای سن، "sex" برای جنسیت، و "religion" برای مذهب استفاده کنیم. به جای age، sex و religion، می‌توانید از هر نام دیگری برای متغیرها استفاده کنید، مانند v1، v2، و v3. همیشه راحت است که یک کتابچه کد در MS Word یا MS Excel تهیه کنید که در آن نام‌های متغیرهای Stata، نام‌های واقعی متغیرها (برچسب‌های متغیر) و کدهای متغیرها (برچسب‌های مقادیر) ثبت شود (جدول ۲.۱). کتابچه کد هنگام تحلیل داده‌ها مفید است.

استفاده از متغیرهای عددی به جای متغیرهای رشته‌ای (کاراکتری) برای یک فایل داده راحت‌تر است. متغیرهای عددی کدهای عددی دارند (مثلاً ۱= مرد؛ ۲= زن). متغیرهای رشته‌ای ممکن است کدگذاری شده یا نشده باشند. اگر یک متغیر رشته‌ای کدگذاری شده باشد، با حروف کدگذاری می‌شود (مثلاً m= مرد؛ f= زن). هنگامی که یک متغیر رشته‌ای کدگذاری نشده باشد، داده‌ها مستقیماً در فایل داده وارد می‌شوند. به‌عنوان مثال، داده‌های جنسیت (مرد/زن)، مذهب (اسلام/هندو/دیگر) و شغل (کسب‌وکار/دارنده شغل/دیگر) ممکن است مستقیماً در فایل داده وارد شوند. توجه داشته باشید که Stata اجازه نمی‌دهد برای متغیرهای رشته‌ای کدگذاری‌شده (مثلاً m= مرد؛ f= زن) برچسب مقدار اعمال شود.

جدول ۲.۲ برخی از داده‌ها (به‌عنوان مثال) را نشان می‌دهد که با استفاده از پرسشنامه (جدول ۲.۱) جمع‌آوری شده‌اند. ما از این داده‌ها برای تولید یک فایل داده در Stata استفاده خواهیم کرد.

جدول 2.1 کتاب کدهای پرسشنامه

نام متغیر در Stata نام واقعی متغیر / برچسب متغیر کد متغیر / برچسب‌های مقدار
idno شماره شناسایی مقدار واقعی
age سن به سال مقدار واقعی
sex جنسیت* m= مرد، f= زن
religion مذهب 1= اسلام/مسلمان، 2= هندو، 3= دیگر
occu شغل 1= کسب‌وکار، 2= شغل دولتی، 3= شغل خصوصی، 4= دیگر
income درآمد ماهانه خانواده به تاکا مقدار واقعی
marital وضعیت تأهل 1= متاهل، 2= مجرد، 3= دیگر
diabetes دیابت شیرین 1= بله، 2= خیر
sbp فشار خون سیستولیک به میلی‌متر جیوه مقدار واقعی
dbp فشار خون دیاستولیک به میلی‌متر جیوه مقدار واقعی

جدول 2.2 داده های جمع آوری شده از افراد مورد مطالعه (فقط بخشی نشان داده شده است)

idno age sex religion occu income marital
1 26 m 1 2 25000 1
2 28 f 2 2 35000 1
3 29 f 1 1 60000 1
4 34 m 1 3 20000 2

این داده‌ها شامل متغیرهای شناسه (idno)، سن (age)، جنسیت (sex)، مذهب (religion)، شغل (occu)، درآمد (income) و وضعیت تأهل (marital) هستند.

برای باز کردن برنامه Stata، روی آیکون Stata دوبار کلیک کنید. شما رابط کاربری Stata (Stata/SE 13.0) را مشاهده خواهید کرد که در شکل 1.1 فصل اول نشان داده شده است. ساده‌ترین روش برای تولید یک فایل داده از طریق ویرایشگر داده‌ها است. برای دسترسی به ویرایشگر داده، از نوار منو انتخاب کنید:

پنجره > ویرایشگر داده

یا

داده > ویرایشگر داده > ویرایشگر داده (ویرایش)

یا

روی آیکون  در نوار ابزار کلیک کنید.

شما "ویرایشگر داده (ویرایش)  بدون عنوان" را مشاهده خواهید کرد که در شکل 2.1 نشان داده شده است. این پنجره برای تعریف متغیرها و همچنین وارد کردن داده‌ها استفاده می‌شود. برای ایجاد یک فایل داده مراحل زیر را دنبال کنید:

مرحله 1: اولین متغیر ما "idno" است (جدول 2.2). وقتی نشانگر موس در اولین ستون ردیف اول قرار گیرد، در کادر بالای صفحه "var1[1]" نمایش داده می‌شود. اولین مقدار متغیر "idno" را مطابق با جدول 2.2 وارد کنید (که عدد 1 است، یعنی فقط 1 را تایپ کنید و دکمه "Enter" را فشار دهید). خواهید دید که "var1" در بالای اولین ستون ظاهر می‌شود (شکل 2.2).

حالا مقدار متغیر دوم "age" (که 26 است) را در اولین خانه از ستون دوم وارد کنید و "Enter" را فشار دهید. خواهید دید که "var2" در بالای ستون دوم ظاهر می‌شود. به همین ترتیب، مقادیر سایر متغیرها را در صفحه‌گسترده ویرایشگر داده Stata وارد کنید.

اگر اولین مقداری که برای یک متغیر وارد می‌شود عدد باشد، Stata آن را به‌عنوان یک متغیر عددی در نظر می‌گیرد و به‌طور خودکار فقط اعداد را به‌عنوان مقادیر آن متغیر می‌پذیرد. مقادیر عددی ممکن است با علامت مثبت یا منفی شروع شوند و شامل اعشار باشند. اما اعداد نباید شامل کاما (,) باشند، مانند 10,000 یا 1,000,000.

اگر اولین مقداری که برای یک متغیر وارد می‌شود یک کاراکتر غیر عددی (مانند m، f یا هر حرف دیگری) باشد، Stata آن را به‌عنوان یک متغیر رشته‌ای (متنی) در نظر می‌گیرد. یک متغیر رشته‌ای می‌تواند مقادیری به طول حداکثر 244 کاراکتر داشته باشد و می‌تواند ترکیبی از حروف، اعداد، نمادها و فضاها باشد.

شکل 2.1 صفحه گسترده ویرایشگر داده Stata

شکل 2.2 ویرایشگر داده Stata با نام متغیرها

در ویرایشگر داده‌ها (Data Editor) یا مرورگر داده‌ها (Data Browser)، مقادیر متغیرهای رشته‌ای به رنگ قرمز، مقادیر متغیرهای عددی به رنگ سیاه و مقادیر متغیرهای عددی با برچسب (کدگذاری شده) به رنگ آبی نمایش داده می‌شوند.

مرحله 2: در این مرحله، نام‌های متغیرهایی که به طور خودکار توسط Stata تولید شده‌اند (مانند var1، var2 و var3) را با نام‌های متغیر که در دفترچه کد (Codebook) آمده است (مانند idno، age و ...) جایگزین خواهیم کرد. برای مثال، باید متغیر اول "var1" را به "idno"، متغیر دوم "var2" را به "age" و به همین ترتیب تغییر نام دهیم.

در پنجره ویرایشگر داده‌ها، سه پنجره به نام‌های "Variables"، "Properties" و "Data" وجود دارند. در پنجره "Variables"، نام‌های متغیرهایی که به طور خودکار ایجاد شده‌اند (مانند var1، var2 و var3) نمایش داده می‌شوند. بر روی "var1" در پنجره "Variables" کلیک کنید و در پنجره "Properties" خواهید دید که نام "var1" مقابل "Name" قرار دارد. دو بار روی "Name" در پنجره "Properties" کلیک کرده، "var1" را حذف کرده و "idno" را تایپ کنید. این کار "var1" را با "idno" جایگزین خواهد کرد. اکنون می‌توانید نام جدید متغیر (idno) را هم در صفحه گسترده (spreadsheet) و هم در پنجره "Variables" مشاهده کنید. به همین صورت، تمام متغیرهای تولید شده خودکار توسط Stata را با نام‌های دلخواه خود جایگزین کنید.

همچنین می‌توانید از دستور زیر برای تغییر نام متغیر استفاده کنید:

rename var1 idno

این دستور، متغیر "var1" را به "idno" تغییر نام می‌دهد.

مرحله 3: اکنون برچسب متغیرها را یکی یکی وارد خواهیم کرد. برای نوشتن برچسب متغیر برای "idno"، روی متغیر "idno" در پنجره "Variables" کلیک کنید و دو بار روی "Label" در پنجره "Properties" کلیک کرده، "serial no" را تایپ کنید. این کار برچسب متغیر "idno" را به "serial no" تغییر خواهد داد. به همین ترتیب، تمام برچسب‌های متغیرها را مطابق دفترچه کد تکمیل کنید. راه دیگری برای برچسب‌گذاری یک متغیر استفاده از دستور زیر در پنجره دستورات (Command window) است:

label var idno "serial no"

این دستور، متغیر "idno" را به "serial no" برچسب‌گذاری می‌کند.

مرحله 4: در این مرحله، برچسب‌های مقادیری را که به متغیرها اختصاص داده شده است، تعیین خواهیم کرد. از آنجا که متغیرهای "idno" و "age" متغیرهای دسته‌بندی‌شده نیستند (یعنی این متغیرها کدگذاری نشده‌اند)، نیازی به برچسب مقادیر ندارند. برچسب مقادیر فقط برای متغیرهای دسته‌بندی‌شده که به صورت عددی کدگذاری شده‌اند، لازم است. Stata برچسب مقادیر را برای متغیرهای رشته‌ای نمی‌پذیرد. بنابراین، باید برچسب‌های مقادیر را فقط برای متغیرهای عددی کدگذاری شده مانند "religion"، "occupation" و دیگر متغیرهای مشابه اختصاص دهیم.

برای اختصاص برچسب مقادیر به متغیر "religion"، می‌توانید از دستور زیر استفاده کنید یا مراحل زیر را دنبال کنید:

label define religion 1 "Muslim" 2 "Hindu" 3 "Others"

یا به سادگی:

la de religion 1 "Muslim" 2 "Hindu" 3 "Others"

یا این مراحل را دنبال کنید:

    در پنجره "Variables" در ویرایشگر داده‌ها، متغیر "religion" را انتخاب کنید.

    روی "Value Label" در پنجره "Properties" کلیک کنید.

    یک پیکان کشویی و یک جعبه کوچک با 3 نقطه مشاهده خواهید کرد.

    روی جعبه سه نقطه کلیک کنید.

    روی "Create Label" کلیک کنید.

    "religion" را در جعبه "Label name" بنویسید.

    1 را در جعبه "Value" بنویسید، "Muslim" را در جعبه "Label" نوشته و "Add" را کلیک کنید.

    2 را در جعبه "Value" بنویسید، "Hindu" را در جعبه "Label" نوشته و "Add" را کلیک کنید.

    3 را در جعبه "Value" بنویسید، "Others" را در جعبه "Label" نوشته و "Add" را کلیک کنید.

    روی "OK" و سپس "Close" کلیک کنید.

    در پنجره "Properties"، روی "Value Label" کلیک کرده و از پیکان کشویی "religion" را انتخاب کنید.

با انجام این مراحل یا استفاده از دستور، برچسب‌های مقادیر را برای متغیر "religion" و سایر متغیرهای کدگذاری‌شده در فایل داده‌ها وارد کنید و داده‌ها را یکی یکی وارد نمایید.

مرحله 5: پس از تکمیل ورود داده‌ها (یا به صورت جزئی)، باید فایل داده‌ها را ذخیره کنید. برای ذخیره فایل داده‌ها، از منوی بالا گزینه زیر را انتخاب کنید:

File > Save As > انتخاب پوشه > نام فایل را وارد کنید (.dta به صورت پیش‌فرض خواهد آمد) > ذخیره

یا از دستور "save" استفاده کنید:

save "C:\Users\HP\Desktop\practice.dta"

اگر می‌خواهید فایل داده‌ها را با همان نام ذخیره کنید، از دستور زیر استفاده کنید:

save, replace

این دستور، فایل داده‌ها را با همان نام و در همان محل ذخیره می‌کند. گزینه replace در دستور فایل قدیمی را با همان نام جایگزین می‌کند.

دستوراتی برای تغییر نام، برچسب‌گذاری و تخصیص برچسب مقادیر:

    برای تغییر نام متغیر:

rename var1 idno

    برای برچسب‌گذاری متغیر:

label var idno "serial no."

    برای تخصیص برچسب مقادیر به متغیر:

label define religion 1 "Muslim" 2 "Hindu" 3 "Others"
label values religion religion

    برای تغییر برچسب‌های مقادیر:

label define religion 1 "Muslim" 2 "Hindu" 3 "Christian", replace

    برای مخفی کردن برچسب مقادیر در ویرایشگر داده‌ها:

Tools > Value Labels > Hide All Value Labels

یا از دستور:

Browse, nolabel

ایجاد فایل داده‌ای با استفاده از دستورات کپی و پیست

ساده‌ترین روش برای ایجاد یک فایل داده‌ای در Stata، کپی و پیست داده‌ها از یک فایل داده دیگر است، به عنوان مثال از Excel، dBase، SPSS یا دیگر برنامه‌ها. برای مثال، فرض کنید که شما یک فایل داده‌ای در SPSS، Excel یا برنامه‌ای دیگر دارید. شما می‌توانید تمام داده‌ها را از این فایل‌ها به Stata وارد کنید. برای این کار، پنجره "Data Editor" را در Stata باز کنید (از منوی Window > Data Editor). به فایل داده‌ای که می‌خواهید داده‌ها را از آن کپی کنید بروید. داده‌هایی که می‌خواهید وارد کنید را انتخاب کرده و کپی کنید (Control-C) و سپس آن‌ها را در صفحه گسترده پنجره "Data Editor" در Stata پیست کنید (Control-V). Stata به طور خودکار نام متغیرها را به عنوان var1، var2 و var3 و غیره ارائه می‌دهد. نام متغیرها (مانند var1، var2، var3 و دیگران) را به نام‌های دلخواه خود تغییر دهید. همچنین برچسب‌های متغیر و برچسب‌های مقادیر را طبق آنچه که در بخش 2.1.1 گفته شد وارد کنید. در نهایت، فایل داده‌ها را در مکان مورد نظر خود ذخیره کنید (File > Save as > ). این روش برای مجموعه داده‌های کوچک با تعداد کمی از متغیرها مناسب است.

وارد کردن فایل داده‌ای از برنامه‌های دیگر

نسخه 16 و بالاتر Stata گزینه‌ای برای وارد کردن مستقیم داده‌های SPSS به Stata دارد، با استفاده از منوی کشویی [File > Import > SPSS data (*.sav)]. نسخه‌های پایین‌تر این گزینه را ندارند. با این حال، بهترین روش برای وارد کردن فایل داده‌ای SPSS به Stata این است که ابتدا فایل داده‌ای را در SPSS به فرمت Stata ذخیره کنید.

برای مثال، اگر می‌خواهید فایل داده‌ای SPSS به نام "wealth.sav" را به "wealth.dta" در فرمت Stata تبدیل کنید، ابتدا فایل داده را در SPSS باز کنید. سپس مراحل زیر را دنبال کنید: File > Save as > از منوی کشویی "Save as type"، Stata Version 13 SE (*.dta) را انتخاب کنید > نام "wealth" را در جعبه نام فایل وارد کنید > Save.

این کار فایل داده‌ای SPSS "wealth" را به فرمت Stata تبدیل و ذخیره می‌کند. همچنین می‌توانید از برنامه‌های تبدیل داده مناسب برای وارد کردن داده‌ها از SPSS یا دیگر فرمت‌ها به فرمت Stata استفاده کنید.

حذف و وارد کردن متغیرها

حذف یک متغیر

شما می‌توانید متغیرهای ناخواسته را از فایل داده حذف کنید. برای حذف یک متغیر، مراحل زیر را دنبال کنید:

    یک متغیر را در پنجره "Variables" در Stata انتخاب کنید.

    روی آن راست کلیک کرده و گزینه "Drop selected variables" را انتخاب کنید.

همچنین می‌توانید از دستور "drop" برای حذف یک متغیر استفاده کنید. برای مثال، اگر بخواهید متغیر "sex" را از فایل داده حذف کنید، از دستور زیر استفاده کنید:

drop sex

وارد کردن یک متغیر جدید

شما نمی‌توانید یک متغیر جدید را در فایل داده وارد کنید مگر اینکه مقداری (یا مقدار گم‌شده) برای آن متغیر انتخاب کنید. برای مثال، اگر بخواهید یک متغیر جدید به نام "gender" وارد کنید که تمام مقادیر آن برابر با 1 باشد، از دستور زیر استفاده کنید:

generate gender=1

یا:

gen gender=1

اگر بخواهید متغیر "gender" را با مقادیر گم‌شده وارد کنید، از دستور زیر استفاده کنید:

gen gender=0

متغیر جدید به عنوان آخرین متغیر در فایل داده ظاهر خواهد شد. همچنین باید برچسب متغیر و برچسب‌های مقادیر را برای متغیر جدید وارد کنید همانطور که قبلاً توضیح داده شد (بخش 2.1.1).

کپی کردن یک متغیر در همان فایل داده

شما ممکن است بخواهید یک متغیر را در همان فایل داده‌ای که در حال استفاده هستید کپی کنید. فرض کنید که می‌خواهید یک کپی از متغیر "religion" که در حال حاضر در مجموعه داده موجود است، ایجاد کنید. برای این کار، باید یک متغیر جدید ایجاد کنید زیرا فایل داده نمی‌تواند همان نام متغیر را به عنوان نسخه کپی‌اش بپذیرد. بیایید نام متغیر جدید را "religion2" بگذاریم. برای کپی‌کردن دقیق (کلون) متغیر "religion" از دستور زیر استفاده کنید:

clonevar religion2=religion

همچنین می‌توانید از دستور زیر استفاده کنید:

gen religion2=religion

مزیت استفاده از دستور "clonevar" این است که برچسب متغیر و برچسب مقادیر را همانند متغیر قدیمی حفظ می‌کند، از جمله کد مقادیر گم‌شده. از طرف دیگر، اگر از دستور "gen" استفاده شود، برچسب متغیر و برچسب مقادیر در متغیر جدید حفظ نمی‌شود و باید به طور جداگانه وارد شوند.

این دستورالعمل بر تصمیم‌گیری آماری، تحلیل داده‌ها و تفسیر نتایج تمرکز دارد. تکنیک‌های معمول تحلیل داده‌ها در پژوهش‌های کمی را پوشش می‌دهد. موضوعات مطرح‌شده در این کتاب شامل مدیریت داده‌ها، آمار توصیفی، و تحلیل‌های دو متغیره و چند متغیره برای آزمون فرضیه‌ها است، از جمله روش‌های ناپارامتریک و دیگر روش‌ها.

نسخه

Stata به‌طور مداوم در حال تکامل است. این بدین معناست که ممکن است دستورات، گزینه‌ها، عناصر زبانی و دیگر موارد در نسخه‌های آینده تغییر کنند. با این حال، Stata اطمینان می‌دهد که نسخه‌های بالاتر دستورات را بدون توجه به نسخه‌ای که دستورات در آن نوشته شده‌اند، اجرا می‌کنند. بنابراین، انتظار می‌رود که تمام دستورات (نوشتار) استفاده‌شده در این کتاب در نسخه‌های بالاتر (یا پایین‌تر) اجرا شوند.

این کتاب بر اساس نسخه ۱۳ Stata نوشته شده است. اگر شما از نسخه متفاوتی (مثلاً نسخه ۱۷) استفاده می‌کنید، هنوز می‌توانید از دستورات استفاده کنید. اگر مشکلی در اجرای دستوری که در این کتاب آمده در نسخه ۱۷ (یا نسخه‌های دیگر) پیدا کردید، دستور زیر را در ابتدای هر فایل Do (فصل ۳) که ایجاد می‌کنید تایپ کنید:

version 13

این گام ساده اطمینان می‌دهد که فایل Do یا برنامه شما نه تنها در نسخه ۱۷ بلکه در تمام نسخه‌های آینده Stata، حتی اگر آن نسخه‌های آینده تغییراتی در نوشتار برخی از دستورات یا ساختارهای برنامه‌نویسی داشته باشند، به درستی اجرا خواهد شد.

شما می‌توانید از دستور بالا به‌عنوان پیشوند هنگام نوشتن دستور در پنجره فرمان استفاده کنید. به‌عنوان مثال، اگر می‌خواهید دستور ANOVA را در نسخه ۱۷ که در نسخه ۱۳ نوشته شده است اجرا کنید، از دستور زیر استفاده کنید:

version 13: anova..

این دستور نسخه Stata را به ۱۳ تنظیم می‌کند، دستور anova را اجرا می‌کند و سپس نسخه Stata را به حالت قبلی خود بازمی‌گرداند.

رابط کاربری Stata

پس از باز کردن Stata (با دوبار کلیک روی آیکون Stata)، رابط کاربری آن مشابه شکل ۱.۱ خواهد بود. این نرم‌افزار شش پنجره دارد که در شکل ۱.۱ با شماره‌های ۱ تا ۶ نشان داده شده‌اند. هدف هر پنجره در جدول ۱.۱ توضیح داده شده است. همچنین برخی از آیکون‌های مفید در نوار ابزار Stata (شکل ۱.۲) وجود دارند که عملکرد آنها در جدول ۱.۲ آمده است. در فصل‌های بعدی، Stata را به‌طور دقیق‌تر بررسی خواهیم کرد.

مراحل تحلیل داده‌ها

ما برای پژوهش‌های خود داده‌ها را با استفاده از ابزارها و روش‌های مختلف جمع‌آوری می‌کنیم. رایج‌ترین ابزارهای جمع‌آوری داده‌ها، پرسشنامه‌ها و برگه‌های ثبت اطلاعات هستند، در حالی که رایج‌ترین روش‌های جمع‌آوری داده‌ها شامل مصاحبه‌ها (حضوری، تلفنی یا آنلاین)، مشاهدات، معاینات بدنی و آزمایش‌های آزمایشگاهی است. گاهی اوقات از داده‌های موجود (داده‌های ثانویه) برای مطالعات تحقیقاتی خود استفاده می‌کنیم، مانند سوابق بیمارستانی یا داده‌های مربوط به پژوهش‌های دیگر. پس از جمع‌آوری داده‌ها، مراحل تحلیل داده‌ها به شرح زیر است:

  1. کدگذاری داده‌ها، اگر از پرسشنامه یا برگه ثبت پیش‌کد شده استفاده نشده باشد
  2. ایجاد یک فایل داده و وارد کردن داده‌ها
  3. پاکسازی داده‌ها (بررسی خطاها در هنگام وارد کردن داده‌ها)
  4. غربالگری داده‌ها (بررسی مفروضات برای آزمون‌های آماری)
  5. تحلیل داده‌ها
  6. تفسیر نتایج

شکل 1.1 محیط کاربری Stata در ویندوز

شکل 1.2 نمادهای نوار ابزار Stata

جدول 1.1 پنجره‌های Stata و اهداف آنها

پنجره هدف
پنجره فرمان [1] این پنجره برای نوشتن دستورات است. ما دستورات را در این پنجره می‌نویسیم. دستورات زمانی که کلید "Enter" فشرده شود اجرا می‌شوند. شما می‌توانید از کلیدهای "Page Up" و "Page Down" روی کیبورد برای فراخوانی دستورات از پنجره "Review" (پنجره ۶) استفاده کنید.
پنجره نتایج یا خروجی‌ها [2] این پنجره خروجی‌ها را همراه با دستورات اجرا شده نمایش می‌دهد. همچنین اگر مشکلی در دستورات وجود داشته باشد، پیام‌های خطا را نشان می‌دهد. پنجره نتایج حدود ۵۰۰ خط خروجی را نگه می‌دارد. هنگامی که این محدودیت تجاوز کند، Stata خروجی‌های قبلی را حذف می‌کند. اگر می‌خواهید خروجی‌ها را ذخیره کنید، باید یک فایل لاگ تولید کنید تا خروجی‌ها ذخیره شوند. شما می‌توانید نتایج را با استفاده از ماوس یا دکمه‌های <Shift+Page Up/PageDown یا Arrow> مرور کنید.
پنجره متغیرها [3] نام‌های متغیرهای مجموعه داده‌ای که در حال حاضر در حافظه فعال است (یعنی در حال استفاده است) را نمایش می‌دهد. اگر روی یک متغیر در این پنجره دوبار کلیک کنید، آن متغیر در پنجره "Command" ظاهر خواهد شد.
پنجره ویژگی‌ها: پنجره متغیرها [4] در زیر پنجره "Properties"، یک پنجره "Variables" (۴) و یک پنجره "Data" (۵) وجود دارد. پنجره "Variables" ویژگی‌های متغیرها مانند نام متغیر، برچسب متغیر و غیره را نمایش می‌دهد.
پنجره داده‌ها [5] این پنجره نام فایل، مسیر، تعداد متغیرهای مجموعه داده و تعداد مشاهدات را نشان می‌دهد.
پنجره مرور [6] این پنجره دستورات قبلاً اجرا شده در طول یک جلسه تحلیل را نمایش می‌دهد. اگر روی یک دستور در این پنجره کلیک کنید، آن دستور در پنجره "Command" ظاهر شده و با فشردن کلید "Enter" اجرا می‌شود. اگر روی یک دستور در پنجره "Review" دوبار کلیک کنید، آن دستور به‌طور مستقیم اجرا می‌شود و خروجی‌ها را می‌توان در پنجره "Results" مشاهده کرد.

جدول 1.2 آیکون‌های نوار ابزار Stata و عملکردهای آنها

آیکون عملکرد
  برای باز کردن یک فایل داده از مکان مورد نظر.
  برای ذخیره فایل داده.
  برای ذخیره فایل لاگ (فایل نتایج یا خروجی‌ها). شما می‌توانید با استفاده از این آیکون، فایل لاگ را شروع، ببندید، معلق کنید یا از سر بگیرید.
  این آیکون مربوط به ویرایشگر جدید Do-file است. Do-file برای نوشتن، ویرایش و ذخیره دستورات استفاده می‌شود. شما می‌توانید یک فایل Do (فایل دستورات) ایجاد کرده و آن را با استفاده از این آیکون ویرایش کنید.
  این آیکون برای رفتن به ویرایشگر داده‌ها (حالت ویرایش) است. در این حالت، شما می‌توانید داده‌ها را در فایل داده ویرایش یا تغییر دهید.
  این آیکون برای رفتن به ویرایشگر داده‌ها (حالت مرور) است. در این حالت، شما فقط می‌توانید داده‌ها را مرور کرده و مشاهده کنید، ولی نمی‌توانید آنها را تغییر دهید.
  این آیکون برای رفتن به مدیر متغیرها است، جایی که شما می‌توانید نام‌های متغیرها، برچسب‌های متغیرها و برچسب‌های مقادیر را ویرایش (تغییر) کنید.