گزیده نکات درس آمارومدلسازی
مبحث آمار ومدلسازی در رشته های تجربی و ریاضی هر ساله 2 سوال و در رشته انسانی بیش از دو سوال را در درس ریاضی به خود اختصاص می دهد ، به امید این که هیچ دانش آموزانی درس ریاضی را سفید نگذارد .
انواع اطلاعات :
- اطلاعات کیفی :
- این اطلاعات با واژه های توصیفی بیان می شوند . مثلا تاحدی ، خیلی ، کم و...
- نقطه ضعف استفاده از این نوع اطلاعات این است که هر کسی ممکن است برداشت و تفسیر شخصی خود را داشته باشد.
- اطلاعات کمی :
- این اطلاعات با عدد و رقم بیان می شود و قابل اندازه گیری است . مثلا : 20 متر، 5 کیلوگرم و.....
- نقطه قوت استفاده از این است که چون میزان دقیق آنها مهلوم است ف تمام افراد درک واحدی از آنها دارند . تمام افراد درک واحدی از آن ها دارند . در واقع در این اطلاعات « چقدر» و « چه اندازه » کاملا مشخص است .
اندازه گیری :
- تعریف اندازه گیری : اولین گام در رسیدن به اطلاعات عددی ( کمی ) ، اندازه گیری است .
- عوامل مورد نیاز برای اندازه گیری :
- معیار
- مقدار
- خطای اندازه گیری
- عواملی بروز خطای اندازه گیری :
- وسیله اندازه گیری
- فرد اندازه گیر
- ویژگی های خطای اندازه گیری
- E هرگز صفر نمی شود .یعنی همواره خطا داریم .
- E مقدار کوچکی دارد .
- E از واحد اندازه گیری کوچکتراست ونمی توان منفی یا مثبت باشد .
مدل سازی :
- تعریف مدل سازی : بیان مسائل به زبان ریاضی را مدل سازی گویند .
- ویژگی های یک مدل خوب :
- از مفاهیم ساده و ابتدای استفاده شود.
- به پدیده ی مورد نظر نزدیک باشد .
- انواع مدل :
مدل هارا می توان برحسب ویژگی های متغییر دسته بندی کرد :
- برحسب تعداد متغیر:
- مدل های یک متغیره :
- مدل های چند متغیره :
- برحسب توان متغیر:
- توان 1:
- توان 2:
- توان 2 و بیشتر :
- ضرب دو یا چند e مختلف درهم:
روش های حل مسائل مربوط به مدل سازی و خطای اندازه گیری :
- هرگز وجود e را فراموش نکنیم .حتی اگر مسئله به آن اشاره نکرده باشد .
-
فرمول مناسب را می نویسیم ، فرمول های پرکاربرد
- : محیط و مساحت : مربع ، مستطیل ، دایره ، مثلث
- حجم : مکعب ، مکعب مستطیل ، استوانه ، کره
- عدد گذاری نکنیم . در فرمول به جای متغیر ( متغیر+ خطا ) بگذاریم.
- عدد گذاری نکنیم . تمام ضرب و تقسیم ها را انجام می دهیم و e های با توان 2 وبیشتر ونیز چندe مختلف که در هم ضرب شده اند را حذف می کنیم .
- حالا عدد گذاری می کنیم .
- جامعه :
تعریف : مجموعه ای از افراد واشیا است که در مورد آنها موضوع یا موضوعاتی را مطالعه می کنیم .
- سرشماری :
تعریف : وقتی تمام اعضای جامعه را مورد مطالعه قرار می دهیم .
- مشکلات سرشماری :
- وقت گیر بودن
- گران تمام شدن وپر هزینه بودن
- دردسترس نبودن همه ی اعضای جامعه
- امکان از بین رفتن بخشی از جامعه در جریان سرشماری
- اندازه ی جامعه :
تعریف: تعداد اعضای جامعه است .
- نمونه :
تعریف : نمونه زیر مجموعه ی از جامعه است .پس نمونه ویژگی های جامعه را دارد اما از جامعه کوچکتر است .
- مواردی که نیاز به نمونه گیری داریم :
- بزرگ بودن جامعه
- تنوع در جامعه
- ویژگی های یک نمونه خوب :
- به اندازه کافی بزرگ باشد .
- تصادفی باشد .
- بیانگر ویژگی های جامعه باشد.
- نمونه گیری : مهم ترین بخش آمار است .
- اندازه ی نومنه : تعداد اعضای نمونه است .
- داده : نتایج حاصل از اندازه گیری یابررسی نمونه را داده می گویند
- روش های جمع آوری داده :
- داده های از پیش تعیین شده
- پرسش
- مشاهده و ثبت وقایع
- آزمایش
- متغیر تصادفی : موضوع یا موضوعاتی است که بررسی می کنیم .
- انواع متغیر تصادفی : متغیرهای تصادفی را بر حسب قابلیت بیان با اعداد به دو دسته تقسیم می کنند .
-
متغیرهای تصادفی کمی :
- کمی گسسته
- کمی پیوسته
-
متغیرهای تصادفی کیفی :
- کیفی ترتیبی
- کیفی ا سمی
دسته بندی : به سه زیر موضوع دسته بندی می شود :
- دامنه تغییرات :
نکته 1: طول بازه که متغییر در آن تغییر می کند R= MAX – MIN
نکته 2 : داده ها باهم برابر درنتیجه R= 0
- مرکز دسته
انواع فراوانی
- فراوانی مطلق : تعداد دفعاتی که یک داده تکرار شده ، تعداد اعضای یک دسته
- فراوانی نسبی : تعداد تکرار یک داده نسبت به کل داده
- فراوانی تجمعی : تعداد داده های کم تر از یک داده ی خالص
- کلید واژه های مهم :
- نسبی
- تجمعی
- درصد
انواع نمودارها :
- نمودار میله ای:
- این نمودار بیشتر برای متغییر های کمی گسسته و کیفی استفاده می شود.
- نمودار مستطیلی :
- این نمودار بیشتر برای متغیرهای کمی پیوسته مناسب است .
- در این نمودار دو ابزار برای مقایسه داریم :
- اگر طول دسته ها با هم مساوی باشند . ( یعنی عرض مستطیل ها باهم برابرند ) ، معیار مقایسه طول مستطیل هاست .
- اگر طول دسته ها مساوی نباشند ، معیار مقایسه مساحت مستطیل ها خواهد بود .
- نمودار چندبر فراوانی :
- این نمودار برای نشان دادن تغییرات بین دو دسته و داخل دسته ها به کار می رود .
- برای رسم نمودار چندبر فراوانی باید در نمودار مستطیلی ، وسط عرض مستطیل ها را مشخص کرده و به هم وصل کنیم .
- نمودار دایره ای :
- این نمودار را می توان برای تمام انواع متغیرها استفاده کرد .
- برای رسم نمودار دایره ای باید مقدار زاویه ی متناظر با فراوانی هر داده را داشته باشیم
- نمودار ساقه وبرگ :
- زمانی که متغییر های ما گسسته باشند وبخواهیم داده ها را در نمودار ببینیم .شکل کلی ان به صورت جدولی است که دو ستون دارد ، ستون سمت چپ ساقه و ستون سمت راست برگ نام دارد.
شاخص های مرکزی :
- مد :
- داده ایست که بیشترین فراوانی را دارد
- مد داده است ؛ نه فراوانی
- ویژگی های مد :
- در نمودارهایی که فراوانی را برحسب داده ها نشان می دهد ، مد ، قله ی نمودار است .
- مد منحصر به فرد نیست ، می توانیم بیش از یک مد داشته باشیم .
- مد حتما متلق به جامعه نیست ؛ حداقل با یکی از داده ها برابر است .
- مد می تواند وجود نداشته باشد ؛ گاهی اتفاق می افتد که مد نداشته باشیم . مثل زمانی که فراوانی تمام داده ها یکی باشد .
- موارد استفاده : نظرسنجی ها ، رآی گیری ها و انتخابات مهم ترین مواردی هستند که در آن ها از مد استفاده می شود .
- میانه :
- داده ی که نصف داده ها از آن کم تر و نصف داده ها از آن بیشتر هستند ، یعنی همان داده ی وسط .
- اگر تعداد داده ها فرد باشد ، داده ی وسط ، میانه است .
- وقتی تعداد داده ها زوج باشد ، دو داده در وسط داریم : دراین حالت میانگین دو داده ی وسط میانه است .
- ویژگی های میانه :
- میانه منحصربه فرد است ؛ فقط و فقط یک مقدار برای میانه داریم .
- میانه می تواند متعلق به جامعه نباشد ؛ زمانی که تعداد داده ها زوج باشد ، ممکن است میانه با هیچکدام از داده ها برابر نباشد .
- میانه حتما وجو ددارد ؛ همیشه ودر هر شرایطی میانه داریم .
- زمانی که داده ها هم برابرند ، میانه با یکی ازآن ها برابر می شوند .
- چارک ها : ( Q1 , Q2 , Q3 , Q4 )
- Q1 : داده ای که 25 درصد از آن کوچکتر و 75 درصد از آن بزرگترند .
- Q2 : داده ای که 50 درصد داده ها از آن کوچکتر و 50 ئرصد از آن برزگتر ند Q2همان میانه است .
- Q3 : داده ای که 75 درصد داده ها از آن کوچکتر و 25 درصد دادها از آن بزرگترند .
- Q4 : داده ای که تمام داده ها از آن کوچکترند . Q4 همان بزرگترین داده یا MAX است .
ویژگیهای چارک ها :
- چارک ها تمام ویژگی های میانه را دارند.
- میانه و چارک ها با تعداد داده ها مرتبط مرتبط هستند نه با با مقدار داده ها .
- نمودار جعبه ای :
- نمودار جعبه ای نشان دهنده ی تمرکز یا پراکندگی داده هاست . نشان می دهد که بیش تر داد ها در نزدیکی MIN؛ MAX ویا عددی خاص تمرکز دارند .
- ابزار مورد نیاز رسم نمودار جعبه ای :
- MIN ؛ چارک اول ؛ میانه ( چارک دوم ) ؛ چارک سوم ؛ MAX ( چارک چهارم )
- میانگین :
- میانگین ؛ همان معدل داده هاست .
میانگین را می توان به دو نوع حسابی و وزن دار دسته بندی نمود .
- میانگین حسابی : زمانی است که فراوانی یا تکرار هر داده 1 باشد .
- میانگین وزن دار : زمانی است که فراوانی بیش از 1 داشته باشیم .
- کاربرد میانگین در مسائل :
- در این مساله ها عبارت « به طور متوسط » به معنای میانگین است .
- میانگین ادغامی
- روش سریع محاسبه ی میانگین ( استفاده از میانگین حدسی )
- ویژگی های میانگین :
- میانه منحصربه فرد است ؛ فقط و فقط یک مقدار برای میانگین داریم .
- میانه می تواند متعلق به جامعه نباشد ؛ گاهی مقدار عددی میانگین با مقدار مقدار هیچیک از داده ها برابر نیست .
- میانگین همیشه بین کم ترین بیش ترین مقدار داده هاست .
- میانگین وسط مقدار داده هاست ؛ همان مقداری که داده ها از میانگین اضافی دارد ، همان مقدار هم کم دارند .
- میانگین از داده های پرت تاثیر می پذیرد .
* نقاط ضعف شاخص های مرکزی :
* مد : به جز مقداری که بیش ترین فراوانی را دارد ، اطلاعاتی در مورد سایر داده ها به ما نمی دهد .
* میانه : در مورد نحوه ی توزیع در داده های کم تر و بیشتر از میانه اطلاعاتی نمی دهد .
* میانگین : به شدت تحت تاثیر داده های پرت قرار دارد .
- دامنه تغییرات
- چارک های بالا و پائین
- واریانس
- انحراف معیار
- ضریب تغییرات
- دامنه تغییرات :
در فصل 4 توضیح داده شد .
- چارک های بالا و پائین :
زمانی که داده های پرت داشته باشیم . از روش حذف چارک های بالا و پائین استفاده می کنیم . تا جامعه یک دست تر از شده و بتوانیم تحلیل درست تری داشته باشیم .
توجه : در برخی موارد ، بسته به اندازه ی جامعه ( تعداد داده ها ) و میزان نزدیکی داده ها به هم ؛ ممکن است یک دهم داده ها از بالا و پائین حذف شوند .
- واریانس / پرش
روش محاسبه :
- اگر فراوانی داده ها برابر یک باشد .
- برای محاسبه واریانس ؛ محاسبه میانگسن است .و حال برای محاسبه واریانس استفاده کنیم .
- اگر فراوانی داده ها برابر دو باشد .
- گام اول : محاسبه میانگین
- گام دوم : محاسبه واریانس
نکته : در گام دوم واریانس به دست آمده اعشاری می باشد .
- گام سوم کتاب کوچک هدفدار مولف ( هدا سردار زاده ) صفحه ی 100 مراجعه کنید .
ویژگی های واریانس :
- همواره وجو دارد .
- منحصر به فرد است .
- همواره نا منفی است .
- اگر تعداد داده ها با هم برابر باشند ، واریانس صفر می شود .
- واحد واریانس ، مجذور واحد داده هاست .
تاثیر ضرب و جمع اعداد ثابت با داده ها بر واریانس :
- تاثیر ضرب در عدد :
اگر تمام اعداد را در یک عدد ضرب کنیم ، واریانس در مجذور آن عدد ضرب می شود .
- تاثیر جمع عدد ثابت :
جمع یک عدد ثابت با تمام داده ها تاثیری بر واریانس ندارد .
- – انحراف معیار
- ابتدا محاسبه ی میانگین
- محاسبه ی واریانس
- جذر گرفتن از واریانس
ویژگی های انحراف معیار :
- همواره وجود دارد
- منحصر به فرد است .
- همواره نامنفی است .
- واحد آن با واحد داده ها برابر است .
- اگر تمام داده ها با هم برابر باشد ، انحراف معیار صفر می شود .
ضریب تغییرات :
- ضریب تغییرات میزان پراکندگی به ازای یک واحد میانگین است .
- به عبارت دیگر خارج قسمت تقسیم انحراف معیار بر میانگین .
- موارد استفاده :
- مقایسه پراکندگی دو یا چند گروه از داده ها که واحد یکسانی ندارند . مثل مقایسه پراکندگی قد و وزن دانش آموزان یک کلاس .
- برای بدست آوردن ضریب تغییرات مراحل زیر را انجام می دهین :
- پس اول بابیستی میانگین را بدست آوریم .
- سپس واریانس را حساب کنیم .
- حال را واریانس را جذرگرفته تا انحراف معیار بدست آید .
- مقدار بدست آمده برای انحراف معیار و میانگین را در فرمول ضریب تغییرات جایگذاری می کنیم .
- ویژگی های ضریب تغییرات :
- همواره نامنفی است .
- منحصر به فرد است .
- اگر داده ها با هم برابر باشند ، ضریب تغییرات صفر می شود .
- -واحد ندارد