published |
DOI
http://dx.doi.org/10.25098/2.2.32 |
Nawzad. M. Ahmed
Statistics & Information Department , College of Administration & Economy ,
University of Sulaimani, Kurdistan Region , Iraq
Received : 8-3-2018 Revised:28-4-2018
Accepted : 29-4-2018 Published :31-12-2018
Abstract
this study is about fitting a such regression model for Tobit (Truncated), and (censored) data regression models for a sample of persons (n=500), with their sugar rate per person as a response variable (Y), and explanatory variables (X1: Age , X2: Rate of cholesterol.gm/dl, and X3: Triglyceride.gm/dl). (Data of this study were obtained through the follow-up of diabetic patients directly from the laboratories of analysis of blood diseases and diabetes in several laboratories with experience in the city of Sulaymaniyah). The persons whom their sugar rate is above 120gm/dl only remained and the others are censored as a zero values (left censored), also the same set of data was truncated from below, then in truncated sample, only the cases under risk of diabetes (greater than the sugar rate=120gm/dl) are recorded, and the others are omitted from the data set. With remaining explanatory with their actual records, and then after fitting censored and truncated models also in order to detect the unbiased, and consistency of the estimated (Parameters) model, the (marginal effects for explanatory) are calculated and comparing these two models with multiple regression model estimation by an ordinary least square method (OLS).
Keywords:
Censored Regression Model (CRM), Truncated Regression Model (TRM), Maximum Likelihood Estimator (MLE), Marginal Effect (ME), Ordinary Least Square (OLS)
پوخته
ئهم توێژینهوهیه تایبهته به مودیلهكانی(توبت Tobit), بهتایبهتی ههردوو مودیلی (سێنسهرد, بڕدراو ) (censored, and truncated)كه بهكاردههینریت بو بهمودیلكردنی پهرچه كۆڕاوی سنوردار(limited dependent variable) . سامپڵی توێّژینهوه بریتیه له (500كهس) كه ڕێژهی شهكر له خوینیان تۆماركراوه وهك پهرچه گۆڕاو ( dependent variable) لهگهڵ سێ گۆڕاوی تهفسیری (explanatory) كه بریتین له (X1: تهمهن به پێوهری ساڵ, X2: ڕێژهی كولسترۆڵ- ملغم/دیسالتر , X3:جهوری سیانی –ملغم /دیسالتر). ئهو كهسانهی ڕێژهی شهكر له خوێنیاندا زیاتره له 120 ملغم/دیسالتر به ئامانج كراون بۆ بهمۆدێل كردن, لهبهر ئهوه توماركردنی دیاری كراویان بۆ كراوه له سهروو 120ملغم وههاوكات به( سفر)كردنی ڕێژهی شهكر بۆ ئهكهسانهى خوار ئهو ڕێژهیهن بۆ مۆدێل كردنیان به جۆری (مۆدێلی لێژبونهوهی چاودێری كراو-لای چهپ), ههروهها جارێكی تر سڕینهوهی تۆمارهكانی ئهم گۆڕاوه dependent بۆ كهسانی خاوهن ڕێژهی شهكری خوار 120ملغم بۆ بهمۆدێلكردنیان به جۆری (مۆدێلی بڕدراو-لای خوارهوه).
بهشێوهیهكی گشتی پرۆسهی بهمۆدێلكردن (چاودیری-بڕدراو)تهنها ئهوكهسانه دهگرێتهوه كه مهترسی توشبونیان لهسهره به نهخۆشی شهكره . دوای دهرهێنانی مۆدێلهكان و تاقیكردنهوهی پارامیتهرهكانیان و ههڵبژاردنی باشترین مۆدێل و بۆ زانینی كاریگهری تهنیا یان سهربهست (marginal effects) بۆگۆڕاوهكانی كارتێكهر (X1, X2, X3) ههریهكه به تهنیا بۆسهر ڕێژهی شهكر له خوێندا, پێوهری (marginal effects) بهكارهێنراوه بۆ باشترین مۆدێل دوای ههڵبژاردنی . نرخی خهمڵَێنراوی پارهمیتهرهكانی مۆدێلهكانی (سێنسهردو بڕدراو) به ڕێگای لایكلیهودی مهرجدار(conditional likelihood (estimation method)كه نرخهكانیان بێ لایهن و لهههمان كاتدا كونسستن (unbiased &consistent) به بهراورد) لهگهڵ نرخی خهمڵێنراوی پارهمیتهرهكانی مۆدێلی ههمهلێژبونهوه (multiple regression model)بۆ ههمان داتای توێژینهوهكهمان كه به ڕێگای بچوكترین دوجای ئاسایی (ordinary least square: OLS) كه خهسڵتی (بێ لایهنی و كونسست) وون دهكات وسیفهت و توانای گهشتاندنی(generalization property) تێدا نامێنێت و ناتوانێت به باشی لێكدانهوهو شیكردنهوهی داتاكان به باشی ئهنجام بدات كاتێك سانسۆر لهسهر داتاكان ههبێت وهك لهم توێژینهوهیهدا ئاماژهی پێكراوه.
الملخص
هذه الدراسة تتعلق بنماذج (توبت) وخصوصا أنموذجي أنحدار ( المراقبة و المبتور)والمتعلق بالمتغيرات الستجابة المحدودة, ونمذجة البينات لعينة البحث بهذين الأنموذجين . عينة البحث متكون من (500n=) شخص من ثم تسجيل معدل السكر في الدم كمتغير استجابة(Y معتمد), وثلاث متغيرات تفسيرية وهم (X1 : العمر ومقاسة بالسنوات, X2: معدل الكولسترول في الدم ومقاسة بالملغم / ديساليتر, و X3: معدل الدهون الثلاثية ومقاسة أيضا بالملغم / ديساليتر). أن الأشخاص الذين هم يتجاوز لديهم معدل السكر في الدم عن 120 ملغم هم هدف النمذجة لذلك تسجل قيم استجاباتهم (الأستجابة المحدوة) وتصفرالمتبقي من العينة من قيم الاستجابة في الأنموذج المراقبة من اليسار في حين مسح هذه القيم (دون 120 ملغم ) عند نمذجة البيانات بالأنحدار المبتورمن الأسفل.
أذن بشكل عام عملية النمذجة (مراقبة والمبتور) في هذه الدراسة هما للاشخاص الذين هم تحت مخاطرة الاصابة بمرض السكر. وبعد أيجاد النماذج للبيانات تحت الدراسة و من ثم أختبار معالمهم وأختيار أفضل نموذج بينهما و لمعرفة التأثيرات الجزئية للمتغيرات التفسيرية سابقة الذكر على معدلات السكر للاشخاص ,تم أستخدام (التاثيرات الجزئية) لتقديرات معالم الأنموذج الأفضل.علما بأن تقديرات النماذج المقدرة هم (تقديرات الأمكان الأعظم المشروط), و هي تقديرات غير متحيزة و متسقة في ان واحد للبينات المراقبة والمبتورة ,مقارنة بتقديرات لأنموذج الأنحدار المتعدد بطريقة المربعات الصغرى للبيانات ذاتها والتي تكون عادة متحيزة و غير متسقة وبالتالي عدم أمكانية الاعتماد عليها في تفسير النموذج بسبب فقدانها لخاصية العمومية للنماذج.
References:
- D, and Bowling, G. “Regression with Social Data Modelling Continues and Limited Response Variables”,(2004). State University, Dept. of Sociology, Ohio, John Wiley & Sons, Inc., Publication, Hoboken, New Jersy.
- Franses, P. H and Richard. P,(2001). “Quantitative models in Marketing Research “Cambridge University Press.
- Green, W. H, “Econometric Analysis” (2003). Fifth Edition, Upper Saddle River, NJ, Prentice Hall.
- Long, J. S. “Regression Models for Categorical and Limited Dependent Variables” (1997). Thousand Oaks, CA: Saga Publication.
- Maddala, G. S. “Limited Dependent and Qualitative Variables in Econometrics” (1983). Cambridge University Press, Cambridge, UK. ISBN 0-521-33825-5. OCLC 25207809.
- Richard Breen. “Regression Models Censored Sample Selected or Truncated Data”, (1996). Saga Publication Ltd. California 9130, Email:[email protected], ISBN 0-8039-5710-6.
- Stock, James H.; Watson, Mark W. “Introduction to Econometrics” (2003). Addison-Wesley, Bosten. ISBN 0-201-71595-3.
- Tobin, J. “Estimation of relationships for limited dependent variables” (1958), Econometrica. 26(1): P:(24-36).
- O, Henningsen. A” Tools for Maximum Likelihood Estimation”. (2010). R package version 0.7, http://CRAN.R-project.org/package=maxLik. maxLik.
- Wooldridge, J. M. “Econometric Analysis of Cross Section and Panel Data” (2002). MIT Press, Cambridge. ISBN 0-262-23219-7. OCLC 47521388.
.
.