کتاب مدل سازی ‏احتمالاتی ‏مختلط ‏خشکسالی ‏مبتنی ‏بر ‏هیدرولوژی ‏آماری

کتاب مدل سازی ‏احتمالاتی ‏مختلط ‏خشکسالی ‏مبتنی ‏بر ‏هیدرولوژی ‏آماری

شناسه محصول: 67171

219,800 تومان

تعداد صفحات

157

انتشارات

عنوان کتاب:

مدل سازی ‏احتمالاتی ‏مختلط ‏خشکسالی ‏مبتنی ‏بر ‏هیدرولوژی ‏آماری

 

نویسندگان:

دکتر ‏سید ‏وحید ‏شاهویی

 

 

سخنی با خواننده

خشکسالی واژه­ای است که در سالیان اخیر به کرات در محافل علمی و غیرعلمی به گوش همگان رسیده است و همواره سخن از اثرات زیانبار آن به میان آمده است. رشد روزافزون جمعیت و به سبب آن گسترش نیازهای مرتبط با آن از یکسو و از سوی دیگر با توجه محدود بودن منابع آبی موجود در کشور، اهمیت شناخت و درک درست و مناسبی از مفهوم خشکسالی را محرز می­نماید. در این کتاب که از پایان نامه دوره کارشناسی ارشد اینجانب در رشته مهندسی منابع آّب دفاع شده در دانشگاه ارومیه استخراج شده است، ابتدا راجع به مفهوم خشکسالی و انواع آن سخن به میان آمده است تا خواننده با انواع خشکسالی­هایی که از لحاظ علمی تعریف می­یابد آشنا شود. در ادامه شاخص­هایی که به واسطه آن­ها شروع، تداوم و خاتمه خشکسالی معنا پیدا می­کند، بیان شده است. خواننده در این کتاب با تعریف توابع مفصل آشنا شده و نحوه مدل­سازی احتمالاتی مشخصه­های خشکسالی (بزرگی، شدت و مدت) را با استفاده از این توابع و با توجه به توزیع احتمالاتی هر کدام از این مشخصه­ها را به صورت مثال­هایی عملی فرا می­گیرد.

همچون هر اثر دیگری این کتاب نیز از کاستی­ها و معایب ناخواسته مصون نیست و امید است دانشجویان و محققین گرامی با مطالعه این کتاب و بیان نمودن نظرات خود در راستای بهبود مطالب و محتوای آن، بنده را یاری رسانند. در انتها بر خود لازم می­دانم از تمامی زحمات و مساعدت­های استاد گرانقدر و پرمایه­ام جناب آقای دکتر مجید منتصری، هیئت علمی محترم گروه علوم و مهندسی آب دانشگاه ارومیه و همچنین تمام عزیزاتی که در نگارش این کتاب بنده را یاری رساندند، تشکر نمایم.

 

سید وحید شاهویی

 

مقدمه

انسان از گذشته­های دور با آب پیوندی مستحکم دارد. منابع آب در شکل­گیری اکثر تمدن ها دارای نقش مهم و حیاتی است به­گونه­ای که بخشی از آئین­ها و مراسم ملل مختلف درباره­ی این مایع مهم و حیاتی می‌باشد. اهمیت آب نزد مللی که در نقاط کم آب جهان زندگی می کرده­اند و می‌کنند بسیار بیش از سایرین است. حجم آب موجود در جهان 2/1 میلیارد کیلومتر مکعب برآورد می‌شود که می‌توان آن را به شکل لایه­ی مایعی به عمق 2650 متر فرض کرد که به­طور یکسان سرتاسر زمین را احاطه کرده است. از این مقدار آب 98% آن در اقیانوس­ها و دریاها قرار دارد که شور است و قسمت اعظم آب شیرین زمین در کلاهک­های یخی قطبی ذخیره شده است. تنها کمتر از 1% آن به صورت منابع آبی، در دسترس انسان قرار دارد که برای کشاورزی و شرب قابل مصرف است.

هنوز هیچ کشوری برای منابع آب درگیر جنگ نشده است و این در حالی است که متخصصان هشدار می­دهند روزی منابع موجود آب، کفاف مصرف جمعیت جهان را نخواهد داد و جنگ بر سر منابع آن بین کشورها آغاز خواهد شد. این پیشبینی با بررسی رقم رشد مصرف آب به میزان دو برابر رشد جمعیت دور از ذهن نخواهد بود. در کشورهای در حال توسعه میزان آب مصرفی برای هر هکتار دو برابر کشورهای توسعه یافته می‌باشد. در حالی که محصول برداشت شده از هر هکتار معادل یک سوم این کشورهای پیشرفته می­باشد. در این کشورها میزان زیادی از آب در شبکه­های انتقال آب به هدر می­رود که این میزان در ایران به 30% می رسد. نرخ آب بها در ایران به حدی پایین است که حساسیت مشترکین را بر نمی­انگیزد تا الگوی مصرف خود را اصلاح کنند. اگر قهر طبیعت در سال­های اخیر و تغییر شرایط آب و هوائی را هم که شاید انسان مسیب آن است، به عوامل فوق اضافه کنیم در­می­یابیم که بحران آب جدی است.

خشكسالی به­عنوان بی سروصدا ترین بلای طبیعی در مقابل سیلاب به عنوان یكی از پر صدا­ترین بلایا قرار گرفته است. این درحالی است كه خطر و خسارت­های ناشی از خشكسالی به­مراتب بیشتر از سایر بلایای طبیعی مانند: سیل، طوفان، آتش فشان و حتی زلزله است. ولی به دلیلی كه مشاهده­ی تاثیر تخربی خشكسالی نیاز به زمان به نسبت طولانی دارد، مطالعه و تحقیق و نحوه برخورد با آن كمتر مورد توجه قرار گرفته است.

وقوع یك دوره خشكسالی شدید علاوه بر خسارت­های آشكاری که به­طور معمول به محصولات كشاورزی، فضای سبز و دامپروری وارد می­کند و گاهی باعث قحطی می‌شود، خسارت­های ناپیدای دیگری را نیز باعث می­شود كه در مواردی جبران ناپذیر از حوزه­های پیدا و آشكار آن است.

برای در امان ماندن از زلزله، آتش فشان و سیلاب كافی است برای مدت كوتاهی از مركز وقوع این بلاها فاصله گرفت، ولی در صورت وقوع خشكسالی، كل یك جامعه در یك دوره­ی زمانی طولانی خسارت خواهند دید و گریز از آن بدون برنامه­ریزی میسر نخواهد بود.

خشكسالی حالتی طبیعی و مستمر از اقلیم است، در حالی كه بسیاری به اشتباه آن را واقعه­ایی تصادفی می­پندارند. این پدیده به تقریب در تمامی مناطق اقلیمی رخ می‌دهد ولی مشخصه­ی آن از یك منطقه به منطقه­ای دیگر به طور كامل تفاوت دارد.

خشكسالی یك اختلال موقتی است و با خشكی تفاوت دارد چرا كه خشكی­ها صرفاً محدود به مناطقی با اندك بارندگی است و حالتی دائمی از اقلیم است. گرچه تعاریف متعددی برای این پدیده ارائه شده لیكن در كل می­توان خشکسالی را حاصل كمبود بارش در طی یك دوره­ی ممتد زمانی (به طور معمول یك فصل یا بیشتر) دانست. این كمبود منجر به نقصان آب برای برخی فعالیت­ها، گروه­ها و یا یك بخش زیست محیطی می‌شود. همچنین دمای بالا، باد شدید و رطوبت نسبی پایین­تر در بسیاری از نقاط جهان با این پدیده همراه شده و به­ طرز قابل ملاحظه‌ایی برشدت آن می­توانند بیفزایند. خشكسالی­های اخیر در هر گروه كشورهای توسعه یافته و درحال توسعه، نتایج اقتصادی، تاثیرات زیست محیطی و دشواری­های شخصی به بار آورده كه جملگی باعث شده‌اند كه آسیب­پذیری تمامی جوامع به این پدیده­ی زیانبخش طبیعی، مد نظر قرار گیرد.

خشكی و خشكسالی با وجود شباهت­های زیادی که دارند، مترادف نیستند. خشكی از ویژگی­های بارز اقلیمی نواحی خشك و نیمه خشك، دلالت بر شرایطی دارد كه میانگین بارش یا آب قابل دسترس، كم باشد درحالی كه خشكسالی در هر منطقه­ای و با هرنوع آب و هوایی می­تواند روی دهد.

خشكسالی به دوره­ای از زمان اطلاق می‌شود كه عرضه­ی رطوبت در آن زمان در سطح مشخص كمتر از حد انتظار شرایط معمول آب و هوایی باشد. به ­طور كلی محققین خشكسالی را از نظر جوی، هیدولوژی و كشاورزی مورد بحث قرار می­دهند و بعضی نیز اصطلاح خشكی را از نظر جامعه شناسی معرفی كرده­اند كه در آن آب قابل استحصال كمتر از حد مورد انتظار برای فعالیت­های اقتصادی و اجتماعی می­باشد. به طور كلی خشكسالی از دو جزء تشكیل شده است:

1- جزء آب و هوایی كه منجر به كاهش بارش و آب قابل استحصال می­شود و 2- جزء تقاضا برای مصرف آب. به طور معمول در برخورد با پدیده­ی خشكسالی، عمده­ی فعالیت در جزء دوم، یعنی كاهش تقاضا برای مصرف متمركز می‌شود. كه با این حال اگر چه برنامه ریزی­ها برای مواجه شدن با پدیده­ی خشكسالی می­تواند تا حد زیادی مؤثر باشد اما قبل از هر­گونه برنامه­ریزی باید مشكل­های اساسی كه مانع اجرای فعالیت مورد نظر می­شود را شناسایی كرد.

بدون شك، خشكسالی به عنوان یك پدیده­ی آب و هوایی ممكن است هرازچند­گاهی رخ دهد؛ اما آیا در طول دوره­های خشكسالی گذشته، برای آینده به دنبال برنامه ریزی مدونی بوده‌ایم؟!!

 

 

فهرست
عنوان صفحه
مقدمه 7
فصـل اول 15
خشکسالی و ویژگی¬های آن 15
خشکسالی 17
تعریف مفهومی خشکسالی 17
تعریف عملی خشکسالی 18
انواع خشکسالی 24
خشکسالی هواشناسی 24
خشکسالی کشاورزی 25
خشکسالی اقلیم شناسی 26
خشکسالی هیدرولوژیک 26
خشکسالی اقتصادی – اجتماعی 27
خشکسالی سبز 28
شاخص‌های خشکسالی 29
ارزیابی خشکسالی 29
نمایه¬ها و شاخص‌های خشکسالی 30
شاخص‌های خشکسالی مبتنی بر بارندگی 31
شاخص درصدی از نرمال (PNPI) 32
شاخص دهک¬ها (DI) 33
شاخص ناهنجاری بارندگی (RAI) 35
شاخص نیچه (NITZCHE) 36
شاخص بارش استاندارد (SPI) 37
شاخص نمرهZ 39
شاخص Z چینی (CZI) 40
شاخص Z چینی تعدیل یافته (MCZI) 41
شاخص معیار بارندگی سالیانه (SIAP) 41
شاخص بارش قابل اطمینان (DRI) 42
شاخص بالم ومولی (BMDI) 43
ارزیابی و مقایسه‌ی شاخص‌های خشکسالی 45
مشخصات و اجزای خشکسالی 47
تئوری ران 48
فصـل دوم 51
هیدرولوژی آماری 51
بررسی و آزمون داده‌های هیدرولوژیکی 52
بررسی و تصحیح و تکمیل داده‌های هیدرولوژیکی 52
میانگین¬گیری ساده¬ی ریاضی 53
نسبت توازنی 54
گرادیان بارندگی با ارتفاع 54
روش رگرسیونی 54
همگن بودن، تصادفی بودن و ایستا بودن داده‌ها 56
همگن بودن داده‌ها 56
تصادفی بودن داده‌ها 57
ایستایی بودن داده‌ها 59
توابع توزیع احتمالاتی 60
توزیع نرمال 61
توزیع لاگ نرمال دو پارامتره 61
توزیع لاگ نرمال سه پارامتره 62
توزیع پیرسن نوع سوم 63
توزیع لاگ پیرسن نوع سوم 63
توزیع گامبل 63
برازش داده‌ها با توزیع¬های احتمالاتی مختلف 64
ضریب تناوب توزیع نرمال 65
ضریب تناوب توزیع پیرسن نوع سوم 66
ضریب تناوب توزیع گامبل 67
انتخاب تابع توزیع برتر برای داده‌ها 67
آزمون کی – دو 68
آزمون کلموگروف – اسمیرنف 69
آزمون خطای استاندارد 69
آزمون PPCC 70
مشخصات خشکسالی و توزیع احتمالاتی آن¬ها 70
تداوم خشکسالی 70
بزرگی خشکسالی 72
شدت خشکسالی 73
مدل¬سازی احتمالاتی خشکسالی 73
تحلیل تک متغیره خشکسالی 73
تحلیل دومتغیره مختلط خشکسالی 74
توابع مفصل 75
قضیه اسکلار 75
توابع مفصل در هیدرولوژی 77
تابع مفصل کلایتون 77
تابع مفصل گامبل 77
تابع مفصل فرانک 78
تابع مفصل گوسین 78
توابع مفصل و پارامترهای خشکسالی 79
تعیین پارامتر و انتخاب تابع مفصل 80
روش حد اکثر درست نمائی 80
فصـل سوم 83
محاسبه¬ی خشکسالی و توابع مفصل 83
منطقه¬ی مورد مطالعه و ایستگاه¬های انتخابی 84
بررسی اولیه¬ی داده‌های آماری 85
تصحیح و تکمیل آمار 85
آزمون همگنی داده‌ها 86
آزمون تصادفی بودن داده‌ها 88
آزمون ایستایی بودن داده‌ها 90
انتخاب توزیع آماری مناسب 91
روش انجام کار 93
شاخص‌های خشکسالی مورد استفاده 94
مشخصه‌های خشکسالی و توزیع آماری مربوطه 96
توابع مفصل مورد مطالعه 98
نرم افزارهای مورد استفاده 99
فصـل چهارم 101
مدلسازی مختلط دوگانه مشخصه¬های خشکسالی 101
توزیع پراکندگی خشکسالی 101
مقایسه‌ی شاخص‌های خشکسالی 110
مقایسه‌ی شاخص‌های خشکسالی در ایستگاه تبریز 113
مقایسه‌ی شاخص‌های خشکسالی در ایستگاه سنندج 116
مقایسه‌ی شاخص‌های خشکسالی در ایستگاه کرمانشاه 120
توزیع پراکندگی بزرگی و شدت خشکسالی نسبت به زمان 123
بزرگی، شدت و مدت خشکسالی 123
پارامترهای توزیع آماری بزرگی، شدت و مدت خشکسالی‌ها 141
پارامتر توابع مفصل و تابع مفصل منتخب 143
بزرگترین و کوچکترین احتمالات مختلط دوگانه بزرگی – مدت خشکسالی‌های ماهیانه با استفاده از توابع مفصل 144
بزرگترین و کوچکترین احتمالات مختلط دوگانه شدت – مدت خشکسالی‌های ماهیانه با استفاده از توابع مفصل 146
منـابع و مآخـذ 151
منابع فارسی 151
منابع غیر فارسی 155

 

 

فصـل دوم

هیدرولوژی آماری

 

خشکسالی نوعی پدیده­ی اقلیمی برگشت پذیر و واقعیتی اجتناب ناپذیر در اقلیم­های مختلف می‌باشد که در اثر کمبود بارندگی طی یک دوره­ی زمانی اتفاق می‌افتد و در مناطق خشک و نیمه خشک با روندی افزایشی در حال گسترش می‌باشد (انصاری، 1389). خشکسالی در اثر کمبود طبیعی رژیم بارشی در منطقه­ی تحت تأثیر ایجاد می‌گردد که معمولاً یک فصل و یا بیشتر تداوم می‌یابد. بارندگی یکی از مهم­ترین و عمده­ترین متغیرهایی است که از آن در تعریف خشکسالی استفاده می‌شود (هونام و همکاران، 1975). بررسی آمار ثبت شده بارندگی می‌تواند کمک شایانی به تحلیل خشکسالی کند. تحلیل خشکسالی با استفاده از متغیر هیدرولوژیکی بارندگی نیازمند آماری دقیق و طولانی مدت می‌باشد تا به نتایجی که از تحلیل بارندگی حاصل می‌شود بتوان اطمینان کرد.

پارامترهای مهم و حیاتی مرتبط با خشکسالی که در طراحی‌ها و برنامه­ریزی‌های محیطی مورد نیاز هستند شامل تداوم[1]، بزرگی[2] و شدت[3] خشکسالی می‌باشند. تداوم و شدت خشکسالی دو ویژگی اولیه و اساسی خشکسالی می‌باشند که مستقیماً به مقادیر پارامتر مورد بررسی (بارندگی) وابسته هستند. بزرگی خشکسالی پارامتر ثانویه ای است که به تداوم و شدت خشکسالی وابسته می‌باشد ( دراکوپ[4]، 1980 (.

توابع مفصل[5] که برای اولین بار در سال 1959 معرفی شد ابزاری مناسب در تحلیل و مدل­بندی­های دو متغیره و چند متغیره، با استفاده از چندین توزیع آماری تک متغیره همبسته که هرکدام دارای توزیع احتمالاتی خود هستند، می‌باشد.

در اکثر موارد داده‌های هیدرولوژیکی دارای آمار مشکوک و یا منقطع می‌باشند که در مطالعات هیدرولوژیکی بایستی این داده‌ها را تصحیح و تکمیل نماییم. یکی از اقدامات اولیه ای که در مراحل ابتدایی هر پروژه­ای باید صورت گیرد اطمینان حاصل کردن از کامل و مطمئن بودن داده‌های مورد استفاده می‌باشد.

در این فصل از کتاب ابتدا به معرفی روش­های معمول بررسی و تصحیح و تکمیل داده‌های هیدرولوژیکی پرداخته می‌شود. در ادامه انواع توزیعات آماری رایج در هیدرولوژی بیان می‌شود سپس روش حداکثر درست نمایی[6] به عنوان روشی برای به­دست آوردن مقدار بهینه پارامترهای یک توزیع اماری معرفی می‌شود و در انتها به معرفی و بررسی توابع مفصل به عنوان ابزاری کارآمد در ساخت توزیع­های آماری مختلط پرداخته شده است.

بررسی و آزمون داده‌های هیدرولوژیکی

هر مطالعه و تحقیقی که بر مبنای داده‌های هیدرولوژیکی انجام می­گیرد باید به­گونه­ای باشد که از نتایج به­دست آمده از این تحقیق و مطالعه مطمئن بود. این مهم با آزمایش و بررسی داده‌های مورد استفاده در تحقیق و قبل از شروع آن میسر می‌باشد. در ادامه انواع روش­ها و آزمون­هایی که در بررسی داده‌های هیدرولوژیکی بایستی انجام بگیرد ارائه شده است.

بررسی و تصحیح و تکمیل داده‌های هیدرولوژیکی

تصحیح و تکمیل داده‌های هیدرولوژیکی در مواردی مطرح می‌باشد که در میان داده‌های آماری موجود انقطاع آماری وجود داشته باشد. علاوه بر این، وجود داده‌های آماری مشکوک (داده‌هایی که دارای اختلاف بزرگی با سایر داده‌ها باشند) در بین سری داده‌ها دلیل دیگر تصحیح و تکمیل داده‌ها قبل از تحلیل و مطالعات می‌باشد (منتصری، 1390).

انقطاع آماری در بین داده‌های ثبت شده هیدرولوژیکی می‌تواند به دلایل زیر باشد (منتصری، 1390):

  • تعویض دستگاه اندازه­گیری
  • تعویض متصدی کار
  • تغییر محل ایستگاه اندازه­گیری.

برای تصحیح و تکمیل آمار در هیدرولوژی روش­های مختلفی مطرح می‌باشد که این روش­ها با توجه نوع داده‌های مورد بررسی متفاوت می‌باشند. تعدادی از این روش­ها به شرح زیر می‌باشد (منتصری، 1390):

  • میانگین­گیری ساده ریاضی
  • نسبت توازنی
  • استفاده از رابطه گرادیان بارندگی نسبت به ارتفاع
  • روش رگرسیونی

میانگین­گیری ساده ریاضی

در این روش داده‌های ایستگاهی را که دارای انقطاع آماری می‌باشد مشخص می­شود. سپس با استفاده از میانگین­گیری حسابی بین داده‌های ایستگاه­های مجاور که آمارشان کامل است، به تکمیل داده‌های ناقص ایستگاه اولیه پرداخته می­شود. باید دقت داشت که استفاده از این روش مستلزم وجود ایستگاه­هایی با آمار کامل و صحیح در مجاورت ایستگاه دارای انقطاع آماری، می‌باشد. فرمول محاسبه میانگین هم به صورت زیر می‌باشد:

(19)

که در آن:  داده ناقص، : جمع مقادیر داده‌های ایستگاه­های مجاور، : تعداد ایستگاه های مجاور می­باشند.

نسبت توازنی

نسبت توازنی برای تکمیل داده‌های یک ایستگاه که دارای نقصان می‌باشد، همان روش میانگین­گیری وزنی می‌باشد که در این روش نسبت فاصله­ی ایستگاه­های مجاور برای ایستگاه مجهول لحاظ می‌شود. در این روش ایستگاه­هایی که به ایستگاه مجهول نزدیک­ترند دارای وزن بیشتر و ایستگاه­های دورتر دارای وزن کمتری در میانگین­گیری می‌باشند. فرمول محاسبه میانگین­گیری وزنی به صورت زیر می‌باشد:

(20)

که در آن:  داده ناقص، : وزن در نظر گرفته شده برای ایستگاه i، : داده ایستگاه i.

گرادیان بارندگی با ارتفاع

در این روش، تصحیح و تکمیل سری داده­ها (بارندگی) با استفاده از رابطه­ی بین بارندگی و ارتفاع صورت می­گیرد. این روش بیشتر در مناطق کوهستانی مطرح می‌باشد و شکل کلی رابطه گرادیان بارندگی با تغییرات ارتفاعی به صورت زیر می‌باشد:

(21)

که در این رابطه: : بارندگی، : ارتفاع، : به ترتیب عرض از مبدأ و ضریب زاویه خط گرادیان بارندگی می­باشند.

روش رگرسیونی

این روش یک روش ساده ریاضی در هیدرولوژی می‌باشد که به­وسیله­ی یک رابطه خطی بین دو سری داده، به تصحیح و تکمیل داده‌های مجهول و ناقص پرداخته می‌شود. اگر دو سری داده موجود باشند، روش رگرسیون وابستگی این دو سری را نسبت به هم مشخص می‌کند و همبستگی بین این دو سری داده را به صورت کمی مشخص می‌کند. همچنین این روش معادله­ی بهترین خطی را که می‌توان در بین دو سری داده رسم کرد را مشخص می‌کند. تئوری را که روش رگرسیون برای به­دست آوردن این همبستگی استفاده می‌کند، تئوری کمترین مربعات می‌باشد، در واقع خط رگرسیونی خطی می‌باشد که مجموع مجذور فاصله­ی نقاط از این خط نسبت به هر خط دیگر، حداقل مقدار خود را دارا می‌باشد. با استفاده از این تئوری، معادله و اجزای خط رگرسیونی به صورت زیر می‌باشند:

(22)
(23)
 (24)

که در آن:  و : دو سری داده موجود، : عرض از مبدأ خط رگرسیونی، : ضریب زاویه­ی خط رگرسیونی، : میانگین حسابی داده‌های سری ، : میانگین حسابی داده‌های سری  و : تعداد داده‌ها می باشند.

مقدار کمی همبستگی بین دو سری داده توسط ضریب همبستگی خطی[7] مشخص می‌شود که با R نشان داده می­شود. رابطه­ی محاسبه­ی ضریب همبستگی خطی بین دو سری داده به صورت زیر می‌باشد:

(25)

همواره مقدار این شاخص مابین 1 و 1- می‌باشد. با توجه به مقدار ضریب همبستگی خطی سه حالت به صورت زیر مشخص می‌شود:

  • : مقدار قدر مطلق ضریب همبستگی به سمت یک میل می‌کند و این بدان معناست که دوسری داده دارای همبستگی شدیدی هستند؛
  • : دو سری داده دارای همبستگی کامل و مستقیم با هم هستند؛
  • : مقدار قدر مطلق ضریب همبستگی به سمت صفر میل می‌کند و این بدان معناست که هیچگونه وابستگی بین دو سری وجود ندارد و سری­های اعداد کاملاً از هم مستقل می‌باشند.

زمانی می‌توان از روش رگرسیونی برای تصحیح و تکمیل آمار در هیدرولوژی استفاده کنیم که همبستگی بین دو سری داده وجود داشته باشد و این همبستگی هم به صورت خطی باشد (منتصری، 1390).

همگن بودن، تصادفی بودن و ایستا بودن داده‌ها

در مطالعات و تحقیقات هیدرولوژیکی همواره بعد از تصحیح و تکمیل داده‌ها باید از همگن بودن، تصادفی بودن و ایستا بودن داده‌ها اطمینان حاصل شود. در این راستا برای هرکدام از موارد ذکر شده آزمون­هایی وجود دارد که به بررسی شرایط مذکور برای داده‌هایی که در مطالعات مورد بررسی قرار می­گیرد، می‌پردازد.

همگن بودن داده‌ها

منظور از همگنی داده‌ها این است که در طول دوره­ی زمانی که داده‌ها ثبت و اندازه­گیری می‌شوند، داده‌های ثبت شده دارای روال منظمی‌باشند بدین معنی که به­طور همگن اندازه­گیری و ثبت شده باشند. از جمله عواملی که می‌تواند باعث عدم همگنی در یک سری داده هیدرولوژیکی شود می‌توان موارد زیر را نام برد (منتصری، 1390):

  • تغییر محل ایستگاه اندازه­گیری؛
  • تعویض دستگاه اندازه­گیری؛
  • تعویض متصدی ایستگاه اندازه­گیری.

در هیدرولوژی برای بررسی همگن بودن داده‌ها از روش جرم مضاعف[8] استفاده می‌شود. در روش جرم مضاعف برای بررسی همگن بودن داده‌های اندازه­گیری شده و ثبت شده در یک ایستگاه، نیازمند یک و یا چند ایستگاه دیگر می­باشیم که داده‌های ثبت شده این ایستگاه­ها باید داده‌های منظم و مطمئنی باشند. در هیدرولوژی ایستگاهی را که داده‌هایش به­منظور بررسی کردن همگن بودن مورد یررسی قرار می‌گیرد، ایستگاه مبنا و ایستگاه یا ایستگاه­هایی را که به­منظور بررسی همگنی داده‌های ایستگاه مبنا مورد تحلیل قرار می‌گیرد، ایستگاه شاهد می­نامند. در روش جرم مضاعف بایستی ایستگاه شاهد در نزدیکی ایستگاه مبنا قرار داشته باشد و اگر چنین شرایطی وجود نداشته باشد از متوسط و میانگین چندین ایستگاه مجاور با ایستگاه مبنا، به­عنوان ایستگاه شاهد استفاده خواهد شد.

مراحل انجام آزمون همگنی داده‌ها با استفاده از روش جرم مضاعف به صورت زیر می‌باشد (منتصری، 1390):

1- انتخاب ایستگاه و یا ایستگاه­های شاهد شامل داده‌های منظم و مطمئن؛

2- مرتب کردن داده‌های ایستگاه شاهد و مبنا به ترتیب سال وقوع؛

3- برآورد مقادیر تجمعی ایستگاه­های شاهد و مبنا؛

4 – رسم نمودار تغییرات مقادیر تجمعی ایستگاه مبنا به ازای مقاددیر تجمعی ایستگاه شاهد؛

5- بررسی و تعیین گرایش خطی نمودار پراکندگی مقادیر تجمعی ایستگاه مبنا و شاهد.

در بررسی و تعیین گرایش خطی نمودار پراکندگی داده‌های تجمعی ایستگاه مبنا و ایستگاه شاهد دو حالت پیش می آید:

  • نمودار پراکندگی داده‌ها از یک خط راست تبعیت می‌کند؛
  • نمودار پراکندگی داده‌ها از دو خط شکسته هر کدام در یک راستا تبعیت می‌کند.

در صورتی که نمودار پراکندگی داده‌ها در راستای یک خط باشد و از یک خط مستقیم تبعیت نماید به این مفهوم می‌باشد که داده‌های ایستگاه مبنا همگن می‌باشد، در صورتی که نمودار پراکندگی داده‌ها در راستای یک خط نباشد و در یک قسمت از نمودار از یک خط راست و در قسمت دیگر از یک خط راست دیگر با شیب متفاوت تبعیت کند، بیانگر این موضوع می‌باشد که داده‌های ایستگاه مبنا همگن نمی‌باشند و بایستی داده‌ها همگن گردند.

در اکثر مواقع تعویض ایستگاه، متصدی و سایر عوامل دیگری که باعث عدم همگنی داده‌های هیدرولوژیکی می‌شوند در سال­های ابتدایی اندازه­گیری صورت می‌پذیرد، پس می­توان گفت که عدم همگنی داده‌ها مربوط به سال­های اولیه اندازه­گیری می‌باشد (منتصری،1390)

تصادفی بودن داده‌ها

هنگامی که از روش­های آماری و احتمالاتی برای تجزیه و تحلیل داده‌های هیدرولوژیکی استفاده می‌شود فرض بر این است که داده‌های هیدرولوژیکی از یک فرآیند طبیعی و تصادفی حاصل شده‌اند و این داده‌ها به عنوان یک متغیر تصادفی شناخته می‌شوند.

عدم تصادفی بودن داده‌های هیدرولوژیکی می‌تواند به سبب عددسازی­های عمدی و یا غیر عمدی در هنگام برداشت و ثبت داده‌های مورد بررسی صورت گیرد که ماهیت تصادفی بودن این داده‌ها را دچار اختلال کند. از جمله عوامل دیگر که باعث عدم تصادفی بودن داده‌های مورد مطالعه می‌باشد، استفاده از روش­های غیرمعمول و نامناسب تصحیح و تکمیل آمار می‌باشد.

در هیدرولوژی برای بررسی تصادفی بودن یک سری داده اندازه­گیری شده از آزمون ران تست[9] استفاده می‌شود. برای استفاده از این آزمون دو فرض  را به صورت زیر در نظر گرفته می‌شود:

  • فرض : با این فرض، تصادفی بودن داده‌ها تأیید می‌شود؛
  • فرض : با این فرض، تصادفی بودن داده‌ها تأیید نمی‌شود.

با استفاده از آزمون ران تست این فرضیات تأیید و یا رد می‌شوند.

مراحل استفاده از این آزمون به صورت زیر می‌باشد:

1- آماده کردن داده‌های مورد نظر: شامل تصحیح و تکمیل آمار و بررسی همگنی داده‌های مورد مطالعه؛

2- مرتب کردن داده‌ها به ترتیب سال وقوع؛

3- محاسبه­ی شاخص مرکزی داده‌ها (میانه، میانگین، مد)؛

4 – تعیین کلاس و طبقه­ی داده‌ها به ازای کوچکتر بودن و یا بزرگتر بودن از شاخص میانه: در این مرحله به داده‌های کوچکتر از میانه کلاس a و به داده‌های بزرگتر از میانه طبقه b نسبت داده می‌شود، به داده‌هایی که برابر شاخص میانه باشند کلاسی تعلق نخواهد گرفت؛

5 – تعداد دنباله a، ( )، مشخص می‌شود. هم­چنین تعداد دنباله های b، ( )، نیز تعیین میگردد؛

6 – تعداد داده‌هایی که دارای طبقه a هستند با ( ) و تعداد داده‌هایی که دارای کلاس b هستند با ( ) نشان داده می‌شود؛

7 – محاسبه­ی آماره­ی آزمون توسط رابطه­ی زیر:

(26)

8 – مقایسه‌ی آماره­ی آزمون محاسبه شده با مقادیر مجاز (محدوده بحرانی)؛

9- در صورتی که آماره­ی آزمون (Z) در محدوده­ی مجاز باشد فرض  تأیید می‌شود و در غیر این صورت، فرض  تأیید می‌شود و نتیجه گرفته می‌شود که داده‌های مورد بررسی تصادفی نمی‌باشند.

محدوده مجاز Z از توزیع نرمال برای سطح اطمینان  تعیین می‌شود. اگر    باشد فرض تصادفی بودن داده‌ها تأیید می‌شود.

ایستایی بودن داده‌ها

یکی از موارد دیگری که در هیدرولوژی مطرح است بررسی ایستایی بودن داده‌های مورد استفاده در مطالعه می‌باشد. اگر شاخص‌های تمایل مرکزی داده‌ها (­میانگین، میانه، نما) با گذشت زمان ثابت باشد و گرایش صعودی و یا نزولی نداشته باشند، ایستایی بودن داده‌ها تأیید می‌شود.

از جمله عواملی که باعث عدم ایستایی بودن داده‌های مورد استفاده در مطالعات می‌باشد، می­توان موارد زیر را ذکر کرد:

  • تغییرات آب و هوایی در یک منطقه می‌تواند هم اثرات افزایشی و هم کاهشی بر شاخص‌های آماری داده‌های ثبت شده هیدرولوژیکی بگذارد که نتیجه ان عدم ایستا بودن داده‌ها می‌باشد؛
  • تغییر کاربری[10]: که این عامل اکثراً در مورد داده‌های دبی و تغییرات کاربری در حوزه­های آبریز مطرح می‌باشد. به­عنوان مثال با افزایش شهرنشینی، اراضی کشاورزی کمتر شده و ضریب رواناب نیز افزایش پیدا کرده است که خود این عامل سبب عدم ایستا بودن داده‌های دبی می‌گردد.

بسیاری از تحلیل­هایی که در هیدرولوژی صورت می‌پذیرد مبتنی بر ایستا بودن داده‌ها می‌باشد، لذا بایستی ایستا بودن داده‌های مورد استفاده در تحقیق نیز مورد بررسی قرار گیرد.

آزمونی که برای بررسی ایستا بودن داده‌ها مورد استفاده قرار می‌گیرد، آزمون همبستگی مرتبه اسپیرمن[11] می‌باشد.

مراحل استفاده از این آزمون به صورت زیر می‌باشد:

  • برقراری فرض که با فرض  ایستا بودن داده‌ها تأیید می‌شود و با فرض  ایستا بودن داده‌ها تأیید نمی‌شود؛
  • مرتب کردن داده‌ها به ترتیب سال وقوع؛
  • مرتب کردن نزولی داده‌ها که در این مرحله اگر بعد از مرتب کردن داده‌ها تکرار وجود داشته باشد، یک جزء اعشاری کوچک به عدد اول قبل از تکرار داده می‌شود؛
  • تعیین رتبه[12] ردیف داده‌های مرتب شده ( که آخرین عدد در ستون رتبه­ها برابر با تعداد کل داده‌ها می‌باشد؛
  • تعیین زمان رخداد داده‌های مرتب شده ( )؛
  • محاسبه­­ی ضریب گرایش[13] ( ) که این ضریب از فرمول زیر محاسبه می‌شود:
 (27)

که در آن : ضریب گرایش و : تعداد کل داده‌ها.

7- محاسبه­ی آماره­ی آزمون توسط رابطه زیر:

(28)

8- مقایسه‌ی آماره­ی آزمون محاسبه شده با مقادیر محدوده­ی مجاز به ازای درجه­ی آزادی  در سطح معنی­دار α با استفاده از توزیع تی – استیودنت[14]؛

9- در صورتی که  باشد فرض  تأیید می‌شود و در غیر این صورت فرض  تأیید می‌شود و نتیجه می‌شود که داده‌ها ایستا نیست.

به طور معمول داده‌هایی که در مقیاس سالانه تهیه می‌شوند ایستا می‌باشند (سالاس[15]، 1993).

توابع توزیع احتمالاتی

هیدرولوژی یکی از اولین علومی می‌باشد که در زمینه­های مهندسی جهت تحلیل پدیده­های طبیعی از مفاهیم آماری استفاده کرده است.

عناصر هیدرولوژیکی پارامتر‌های احتمالاتی می‌باشند و چگونگی وقوع آن­ها در آینده تابعی از خصوصیات آماری وقوع آن­ها در گذشته است بنابراین پیشبینی آب و هوایی یک منطقه بدون وارد شدن به تجزیه و تحلیل­های آماری و احتمالاتی داده‌های ثبت شده امکان­پذیر نمی‌باشد (علیزاده ، 1384)

یوجوویچ[16] در سال 1972 مهم­ترین و پر کاربردترین توزیع­های آماری را که در هیدرولوژی برای داده‌های ماهیانه و سالانه کاربرد دارند را به صورت زیر معرفی کرد:

  • توزیع نرمال
  • توزیع لاگ نرمال دو پارامتره
  • توزیع لاگ نرمال سه پارامتره
  • توزیع پیرسن نوع سوم
  • توزیع لاگ پیرسن نوع سوم
  • توزیع گامبل

توزیع نرمال

تابع چگالی احتمالاتی[17] توزیع نرمال به صورت زیر است:

(29)

که در آن : میانگین داده‌ها، : احراف از معیار داده‌ها، : واریانس داده‌ها می­باشند.

تابع چگالی تراکمی احتمالاتی[18] توزیع نرمال به صورت رابطه­ی (30) می‌باشد:

(30)

توزیع لاگ نرمال دو پارامتره

اگر پس از لگاریتم­گیری از داده‌های موجود مشاهده شود که لگاریتم داده‌ها دارای توزیع نرمال می‌باشد این نتیجه حاصل می‌شود که داده‌ها دارای توزیع لاگ نرمال دو پارامتره می‌باشند. تابع چگالی احتمال و تابع چگالی تراکمی این توزیع همانند توزیع نرمال می‌باشد با این تفاوت که در این توزیع به جای خود داده‌ها لگاریتم داده‌ها در توابع چگالی احتمالاتی و چگالی تراکمی احتمالاتی به­کار برده می‌شود.

(31)

توزیع لاگ نرمال سه پارامتره

در این توزیع متغیر جدیدی به صورت زیر تعریف شود:

(32)

که در آن : داده‌های موجود، : متغیر جدید و : مقدار عددی ثابت می باشد.

اگر متغیرهای جدید ساخته شده دارای توزیع نرمال باشند نتیجه می‌شود که داده‌های اولیه دارای توزیع لاگ نرمال سه پارامتره هستند.

برای برآورد مقدار ثابت در توزیع لاگ نرمال سه پارامتره روش­های مختلفی ارائه شده که سه روش پرکاربرد عبارت است از:

  • روش حد اکثر درست نمایی[19]
  • روش گشتاورها[20]
  • روش چارکی[21]

استفاده از روش سوم برای به­دست آوردن مقدار ثابت توزیع لاگ نرمال سه پارامتره بیشتر مورد استفاده می‌باشد (منتصری، 1390)

در روش چارکی برای محاسبه مقدار ثابت توزیع لاگ نرمال سه پارامتره از فرمول زیر استفاده می‌شود:

(33)

که در آن:

  • : بزرگترین داده­ی مشاهداتی؛
  • : کوچکترین داده­ی مشاهداتی؛
  • : میانه­ی داده‌های مشاهداتی.

توزیع پیرسن نوع سوم

تابع چگالی این توزیع به صورت زیر می‌باشد:

(34)

که در آن:  و  و  پارامترهای آماری این توزیع و : تابع گامای پارامتر .

تابع چگالی احتمالاتی تراکمی این توزیع به صورت زیر می‌باشد:

 (35)

توزیع لاگ پیرسن نوع سوم

اگر لگاریتم داده‌های یک جامعه آماری از توزیع پیرسن نوع سوم پیروی کند، نتیجه می‌شود که داده‌های خود جامعه آماری دارای توزیع لاگ پیرسن نوع سوم می‌باشند. توابع چگالی احتمال و چگالی احتمال تراکمی این توزیع همانند توزیع پیرسن نوع سوم می‌باشد با این تفاوت که در این توزیع متغیر جدید به صورت زیر تعریف می‌شود:

(36)

توزیع گامبل

توزیع حد نهایی نوع اول که به­طور خلاصه گامبل نامیده می‌شود برای داده‌هایی کاربرد دارد که دارای چولگی مثبت می‌باشند. برای داده‌ها با چولگی منفی از توزیع حد نهایی نوع سوم استفاده می‌شود (علیزاده، 1384).

تابع چگالی احتمالاتی این توزیع به صورت زیر می‌باشد:

  (37)

که در آن :

  • : میانگین داده‌ها؛
  • : پارامتر آماری.

تابع چگالی احتمالاتی این توزیع به صورت زیر است:

(38)

برازش داده‌ها با توزیع­های احتمالاتی مختلف

برای برازش داده‌های هیدرولوژیکی با توزیع­های احتمالاتی مختلف روش­های گوناگونی وجود دارد که سه روش عمده در هیدرولوژی که بسیار پر کاربرد است عبارت است از (منتصری، 1390):

  • پارامترهای توزیع؛
  • ضرایب تناوب؛
  • روش گرافیکی.

استفاده از پارامترهای توزیع برای برازش داده‌ها با توزیع­های احتمالاتی زمانی کارآمد و سودمند است که تعداد داده‌های در دسترس زیاد باشد و اگر تعداد داده‌ها کم باشد نمی‌توان به نتایج حاصل از این روش اطمینان کرد.

در روش گرافیکی، با استفاده از کاغذ­های احتمالاتی مخصوصی که محور­های آن بر اساس توزیع­های مختلف درجه­بندی شده است، به برازش داده‌ها پرداخته می‌شود. مشکلی که این روش دارد این است که کاغذ­های احتمالاتی تنها برای توزیع­های نرمال و لاگ نرمال در دسترس می‌باشد.

مزیت استفاده از روش ضرایب تناوب در برازش داده‌ها با توزیع­های احتمالاتی مختلف این است که برای توزیع­های احتمالاتی ذکر شده می‌توان از این روش استفاده کرد و محدودیتی ندارد. در توزیع نرمال، با داشتن احتمالات و دوره برگشت­های مختلف، این ضرایب از کتب آماری قابل استخراج می‌باشد. استخراج ضرایب تناوب در توزیع پیرسن نوع سوم و لاگ نرمال با استفاده از مقادیر چولگی داده‌ها و دوره برگشت­های مختلف صورت می‌گیرد. برای استفاده از این روش در توزیع گامبل علاوه بر داشتن دوره برگشت تعداد داده‌ها نیز باید مشخص باشد.

در هیدرولوژی مقادیر برآوردی توسط توزیع­های احتمالاتی مختلف توسط رابطه چاو[22] تعیین می‌گردد:

(39)

که در آن:

  • : مقادیر برآوردی توزیع احتمالاتی مربوطه؛
  • : میانگین داده‌های مشاهداتی؛
  • : ضریب تناوب توزیع مربوطه؛
  • : انحراف از معیار داده‌های مشاهداتی.

علاوه بر استخراج ضرایب تناوب از کتب آمار، روش­های تجربی نیز وجود دارند که با استفاده از این روابط می‌توان ضرایب فراوانی را محاسبه کرد.

در این قسمت از کتاب به بررسی ضرایب تناوب توزیع­های آماری ذکر شده با استفاده از روش­های تجربی پرداخته شده است.

ضریب تناوب توزیع نرمال

رابطه­ای که برای محاسبه­ی ضریب تناوب توزیع نرمال به کار برده می‌شود به صورت فرمول شماره (40) می­باشد (آبرامووتز و استگان[23]، 1972):

(40)
 (41)

که در آن:

  • : ضریب تناوب توزیع نرمال؛
  • : احتمال وقوع تجربی.

در حالتی که  باشد، برای به­دست آوردن  طبق رابطه­ی فوق، ابتدا باید احتمال عدم وقوع  را تعیین کرده و  برای احتمال عدم وقوع محاسبه می‌شود. سپس  به ازای  محاسبه می‌شود و در آخر مقدار  در یک منفی ضرب می‌شود.

برای محاسبه احتمال تجربی (  روابط متعددی وجود دارد، آرنل و همکاران[24](1986( فرمول تجربی بلوم[25] را برای توزیعای احتمالی نرمال، لاگ نرمال و لاگ پیرسن نوع سوم، مناسب می دانند:

 (42)

که در آن:

  • : احتمال تجربی داده­­ی مرتب شده ردیف ؛
  • : تعداد کل داده‌های مشاهداتی؛
  • : شماره ردیف داده‌های مشاهداتی مرتب شده.

ضریب تناوب توزیع پیرسن نوع سوم

رابطه­ی ریاضی تجربی که برای محاسبه­ی ضریب تناوب در توزیع پیرسن نوع سوم ارائه شده است به صورت زیر است (لوکس و همکاران[26]، 1981):

 (43)

 

که در آن:

  • : ضریب تناوب توزیع پیرسن نوع سوم؛
  • : ضریب تناوب مربوطه در توزیع نرمال؛
  • : ضریب چولگی داده‌های مشاهداتی.

این فرمول همان رابطه­ی ویلسون – هیلفرتی[27] می‌باشد که در واقع ضریب تناوب توزیع پیرسن نوع سوم را برحسب ضریب تناوب مربوطه در توزیع نرمال بیان می‌کند.

ضریب تناوب توزیع گامبل

چاو و همکاران[28] در سال 1998 رابطه­ی تجربی زیر را برای محاسبه­ی ضریب تناوب توزیع گامبل ارائه کردند:

(44)

که در آن:

  • : ضریب تناوب توزیع گامبل؛
  • : احتمال وقوع تجربی.

مقدار احتمال تجربی  در توزیع گامبل توسط رابطه گرینگورتون[29] بیان می‌شود:

 (45)

که در آن:

  • : شماره­ی ردیف داده‌های مشاهداتی مرتب شده؛
  • : تعداد کل داده‌های مشاهداتی.

انتخاب تابع توزیع برتر برای داده‌ها

بعد از توزیع و برازش داده‌ها با توابع توزیع احتمالاتی ممکن است که داده‌ها با چند توزیع احتمالاتی برازش خوبی داشته باشند که برای انتخاب بهترین تابع توزیع و مناسب­ترین گزینه، آزمون­های زیر به کار برده می‌شود:

  • آزمون کی – دو[30]
  • آزمون کلموگروف – اسمیرنف[31]
  • آزمون خطای استاندارد[32]
  • آزمون PPCC[33]

در ادامه به توضیح هر کدام از این آزمون­ها و روابط آن­ها پرداخته شده است.

آزمون کی – دو

اساس این آزمون بر این اصل استوار است که آیا اختلاف معنا داری مابین مقادیر مشاهداتی و مقادیر برآوردی وجود دارد و یا این­که هیچگونه اختلاف معنا داری بین آن­ها وجود ندارد.

این آزمون، یک آزمون معتبر آماری است که به دنبال یک رابطه­ی سیستماتیک در بین دو متغیر می‌باشد.

مراحل استفاده از این روش به ترتیب زیر است:

  1. در نظر گرفتن فرض صفر[34]: اختلاف معنی­داری ما بین توزیع تئوری و توزیع داده‌های تجربی وجود ندارد.
  2. مرتب کردن داده‌های مشاهداتی (داده‌های تاریخی)
  3. محاسبه­ی داده‌های مورد انتظار برآوردی با استفاده از توزیع­های آماری بیان شده؛
  4. محاسبه­ی آماره­ی کی – دو توسط رابطه زیر:
(46)

که در آن:

  • : داده‌های مشاهداتی؛
  • : داده‌های بر­آوردی با استفاده از توزیع­های آماری.

مقدار آماره­ی محاسبه شده با توجه به درجه­ی آزادی (N-1) که N تعداد داده‌ها می‌باشد، با مقادیر بر­آوردی از جدول­های آماری محاسبه می‌گردد، اگر مقدار این آماره از مقدار برآوردی جداول کمتر باشد بدان معناست که فرض صفر پذیرفته می‌شود و هیچگونه اختلاف معنی­داری مابین مقادیر مشاهداتی و مقادیر بر­آوردی وجود ندارد و داده‌ها از توزیع مربوطه پیروی خواهند کرد.

این آزمون در مواقعی که تعداد داده‌ها زیاد باشد دارای دقت قابل قبولی می‌باشد (مید منت[35]، 1992).

آزمون کلموگروف – اسمیرنف

این آزمون نسبت به آزمون کی – دو ساده­تر می‌باشد، مراحل استفاده از این روش را می‌توان به صورت زیر بیان کرد (علیزاده، 1384):

  • در نظر گرفتن فرض صفر[36]: اختلاف معنی­داری ما بین توزیع تئوری و توزیع داده‌های تجربی وجود ندارد.
  • در نظر گرفتن سطح اعتماد α: اغلب در این آزمون سطع اعتماد 5% در نظر گرفته می‌شود.
  • مقادیر برآوردی از توزیع­های احتمالاتی محاسبه می‌شود؛
  • محاسبه اختلاف بین داده‌های مشاهداتی و مقادیر بر­آوردی توسط توزیع­های احتمالاتی؛
  • مشخص کردن حداکثر اختلاف بین داده‌های بر­آوردی و مشاهداتی (تعیین )؛
  • مقایسه با  که از جداول آماری با توجه به سطح اعتماد α و تعداد داده‌های مشاهداتی (n) استخراج می‌شود؛
  • اگر فرض صفر صحیح بوده و داده‌های مشاهداتی از توزیع آماری مربوطه تبعیت خواهند کرد و در غیر این صورت با 95% اطمینان نتیجه می‌شود که داده‌های مشاهداتی از توزیع آماری مربوطه تبعیت نمی‌کنند.

آزمون خطای استاندارد

یکی دیگر از آزمون­هایی که برای پیدا کردن توزیع برتر احتمالاتی بسیار مورد استفاده می‌باشد آزمون خطای استاندارد می‌باشد.

برای محاسبه­ی شاخص این آزمون از فرمول زیر استفاده می‌شود:

(47)

که در آن:

  • : شاخص آزمون خطای استاندارد؛
  • : داده­­ی مشاهداتی i؛
  • : داده­ی برآوردی i از توزیع آماری مربوطه.

با استفاده از رابطه­ی فوق و با توجه به توزیع­های آماری، مقدار  برای هر توزیع مشخص می‌شود. داده­های­های مشاهداتی با توزیعی بهترین برازش را دارند که دارای کمترین مقدار  باشد.

آزمون PPCC

در این آزمون از یک آزمون عددی و همزمان یک آزمون گرافیکی برای تعیین توزیع برتر استفاده می‌شود. آزمون عددی تعیین همبستگی خطی داده‌های مشاهداتی با ضرایب تناوب مربوط به هر توزیع می‌باشد. همزمان پس از تعیین ضریب همبستگی خطی داده‌های مشاهداتی با ضرایب فراوانی توزیع­های آماری برازش گرافیکی صورت گرفته و توزیع برتر انتخاب خواهد شد. برازش گرافیکی هم مابین داده‌های مشاهداتی و توزیع­های آماری مختلف صورت می­گیرد.

مشخصات خشکسالی و توزیع احتمالاتی آن­ها

پارامترهاي مرتبط با خشكسالي كه در طراحي­ها و برنامه­ريزي­هاي محيطي مورد نياز هستند، شامل تداوم[37]، شدت[38] و بزرگي[39] خشكسالي مي‌باشند. تداوم و شدت خشكسالي دو ويژگي اوليه و اساسي خشكسالي مي‌باشند كه مستقيماً به مقادير پارامتر مورد بررسي وابسته هستند. بزرگي خشكسالي، پارامتر ثانويه اي مي‌باشد كه به تداوم و شدت خشكسالي وابسته است (دراکوب[40]، 1980).

تداوم خشکسالی

تشخيص زمان آغاز و پايان خشكسالی بسيار مشكل است. تعيين زمان آغاز خشكسالی به تعريف شاخص مورد استفاده وابسته است. بديهی است كه اين زمان با پايان آخرين بارش مفيد آغاز نمی‌شود، بلكه ممكن است تا زمان اتمام ذخيره رطوبت خاك به­طول انجامد. وقوع بارش­هاي هرچند اندك در زمان آغاز خشكسالی، پيچيدگي خاصي به موضوع مي­بخشد، بنابراين درحالت كلی می‌توان گفت زمان آغاز خشكسالی، زماني است كه ذخيره رطوبتی چه در محيط خاك (خشكسالي كشاورزي) و چه در مخازن آبی (خشكسالی هيدرولوژيك) خاتمه يافته باشد.

زمان آغاز تا پايان خشكسالی كه به­عنوان دوره­ی تداوم خشكسالی شناخته می‌شود، يكي از ويژگي­های اساسی خشكسالی محسوب می‌گردد. مقياس زمانی دوره­ی تداوم يك خشكسالی می‌تواند از روز، ماه تا سال متفاوت باشد. هرمقدار که دوره­ی تداوم خشكسالی طولانی­تر شود، ميزان ذخاير آب منطقه، تحت خطر جدی قرار گرفته و به­ همين جهت می‌تواند شدت خشكسالی صورت گرفته را افزايش دهد.

مدت خشکسالی را می‌توان دوره­اي دانست كه مقدار آب در آن به­طور پيوسته كمتر از يك آستانه معين باشد.

در این کتاب مدت خشکسالی برابر با مدت زمانی که شاخص خشکسالی مورد مطالعه به صورت پیوسته در زیر سطح بحرانی قرار دارد، در نظر گرفته شده است.

در تحلیل­ها و مطالعات مربوط به خشکسالی برای طول مدت خشکسالی تابع توزیع نمایی[41] در نظر گرفته می‌شود (زلنهاستیک و سال وی[42]، 1987 ، سالاس و همکاران[43] 2006 ،شیاو[44]، 2006 و شیاو و مدرس[45]، 2009)

(48)

که در آن:

  • : تابع چگالی احتمال توزیع نمایی؛
  • : طول دوره­ی خشکسالی‌ها؛
  • : پارامتر توزیع نمایی.

تابع چگالی احتمالاتی تراکمی[46] توزیع نمایی به صورت زیر می‌باشد:

(49)

در این کتاب مدت خشکسالی برابر با مدت زمانی که شاخص خشکسالی مورد مطالعه به صورت پیوسته در زیر سطح بحرانی قرار دارد و همچنین تابع توزیع احتمالاتی مدت خشکسالی، تابع توزیع نمایی در نظر گرفته شده است.

بزرگی خشکسالی

بزرگی خشکسالی از جمله مشخصات خشکسالی می‌باشد که در تجزیه و تحلیل­های مرتبط با خشکسالی و برنامه­ریزی‌های کوتاه مدت و بلند مدت مبارزه با خشکسالی، می­تواند عاملی بسیار تأثیرگذار باشد.

بزرگی خشکسالی با توجه به شاخص خشکسالی مورد استفاده برابر با جمع مقادیری از شاخص خشکسالی می‌باشد که به­طور پیوسته زیر حد آستانه قرار دارند؛ به عبارت دیگر بزرگی خشکسالی عبارت است از جمع مقادیر کمبود رطوبت در مدت خشکسالی… در مطالعات خشکسالی برای مقادیر بزرگی خشکسالی تابع توزیع گاما[47] در نظر گرفته می‌شود که تابع چگالی احتمالاتی آن به صورت زیر است (سالاس و همکاران[48]، 2006 و شیاوو[49]، 2006 و شیاو و مدرس[50]، 2009):

(50)

که در آن:

  • : مقادیر بزرگی خشکسالی؛
  • : پارامترهای شکل و مقیاس توزیع گاما.

تابع چگالی احتمالاتی تراکمی توزیع گاما به شکل زیر می‌باشد:

(51)

در این کتاب بزرگی خشکسالی برابر با حاصل جمع مقادیر شاخص خشکسالی در طول مدت خشکسالی و برای مقادیر بزرگی خشکسالی تابع توزیع گاما در نظر گرفته شده است.

شدت خشکسالی

شدت خشکسالی عبارت است از بزرگی خشکسالی بخش بر مدت خشکسالی؛ به عبارت دیگر شدت خشکسالی برابر است با میزان کمبود آب در هر مقیاس زمانی.

تابع توزیع احتمالاتی شدت­های خشکسالی، تابع توزیع گاما می‌باشد (سالاس و همکاران[51]، 2005 ، شیاو[52]، 2006 و شیاوو و مدرس[53]، 2009 ). در این کتاب شدت خشکسالی برابر است با جمع مقادیر شاخص‌های خشکسالی است که به طور ممتد در زیر سطح آستانه قرار داردند بخش بر طول مدت خشکسالی.

مدل سازی احتمالاتی خشکسالی

خشکسالی پدیده­ای است که باید با در نظر گرفتن همبستگی بین پارامترهای آن، مورد بررسی و تحلیل قرار گیرد و در این راستا باید به هرکدام از پارامترهای خشکسالی و همبستگی بین آن ها دقت کرد، سپس به مطالعه­ی خشکسالی پرداخت.

تحلیل تک متغیره خشکسالی

تحلیل فراوانی خشکسالی‌ها در قالب تداوم، شدت و بزرگی پیچیده است زیرا هر یک از این پارامترهای خشکسالی دارای توزیع آماری مختص به خود می‌باشند (موی و همکاران[54]، 1988). بیشتر مطالعاتی که در مورد تحلیل و مدل بندی پارامترهای خشکسالی صورت گرفته است، تحلیل­های تک متغیره­ای می‌باشند که در محاسبات خود تنها یکی از ویژگی­های خشکسالی (مدت، بزرگی و یا شدت) را در نظر گرفته­اند؛ اما همان­طور که بیان شد خشکسالی پدیده­ای پیچیده می‌باشد که در شکل­گیری آن عوامل متعددی دست به دست هم می‌دهند. تحلیل تک متغیره­ی خشکسالی‌ها بدون در نظر گرفتن همبستگی بین متغیرهای خشکسالی چندان در واکاوی و مدل بندی این پدیده نمی‌تواند مفید باشد.

مطالعاتی که در آن­ها به بررسی چند متغیره خشکسالی‌ها که در آن ارتباط بین پارامترهای خشکسالی در نظر گرفته شده باشد بسیار کم صورت گرفته است که از دلایل آن می‌توان موارد زیر را بر شمرد:

  • کمبود داده‌های هیدرولوژیکی؛
  • روش­های پیچیده محاسباتی؛
  • تعداد مدل های آماری محدود.

تحلیل دومتغیره مختلط خشکسالی

تحلیل دو متغیره خشکسالی یکی از حالت­های تحلیل­های چند متغیره می‌باشد که در آن به بررسی و مدل­سازی احتمالاتی مختلط دو پارامتر از خشکسالی (بزرگی – مدت و یا شدت – مدت) پرداخته می‌شود.

تحلیل دو متغیره مختلط خشکسالی (بزرگی – مدت، شدت – مدت) باید با در نظر گرفتن توزیع­های احتمالاتی هر یک از پارامترهای خشکسالی صورت گیرد و در نظر گرفتن توزیع­های احتمالاتی یکسان برای اجزای خشکسالی با واقعیت و ماهیت تصادفی بودن پارامتر‌های خشکسالی تطابقی ندارد و نتایج این مطالعات با واقعیت ناسازگار است (لی و همکاران[55]، 2013).

یکی از راهکارهایی که در سالیان اخیر برای مدل­بندی احتمالاتی دو متغیره و چند متغیره مختلط پدیده­هایی چون خشکسالی، در هیدرولوژی به وجود آمده است، استفاده از توابع مفصل[56] می‌باشد.

 

توابع مفصل

این توابع برای اولین بار توسط اسکلار[57] در سال 1959 معرفی شد. توابع مفصل امکان تحلیل و مدل­بندی چند متغیره، با استفاده از چنیدن توزیع تک متغیره همبسته که هرکدام دارای توزیع احتمالاتی خود هستند را فراهم می‌کند. مزیت استفاده از این توابع آن است که با استفاده از این توابع توزیع­های چند متغیره­ای ساخته می‌شود که همبستگی متغیرها در آن در نظر گرفته می‌شود. مدل­سازی دوگانه مختلط بین دو متغیر با استفاده از قضیه اسکلار[58] صورت می­گیرد.

قضیه اسکلار

اسکلار در سال 1959 نشان داد که هر تابع توزیع چند متغیره مانند  را می‌توان به صورت یک تابع مفصل نوشت. طبق این قضیه اگر H یک تابع تراکمی توزیع مشترک[59] با توابع چگالی احتمالی تراکمی حاشیه ای[60]  و  باشد، آنگاه یک تابع مفصل مانند C وجود دارد به­طوری که:

(52)

که در آن:

  • : تابع تراکمی توزیع مشترک دو متغیر و ؛
  • : تابع مفصل؛
  • : تابع تراکمی توزیع متغیر ؛
  • : تابع تراکمی توزیع متغیر .

طبق این قضیه اگر توابع  و  پیوسته باشند در آن صورت تابع مفصل  یکتاست. از طرف دیگر اگر  یک تابع مفصل یکتا و  و  توابع تراکمی توزیع تک متغیره باشند در این صورت تابع  که توسط رابطه­ی فوق تعریف شد، یک تابع تراکمی توزیع چند متغیره[61] می‌باشد.

تابع چگالی احتمالاتی مشترک[62] بین دو متغیر  و  که هر کدام دارای توزیع­های حاشیه ای[63] خود می‌باشند و با توجه به تابع مفصل ، به صورت زیر است:

(53)

 

که در آن:

  • : تابع چگالی احتمالاتی مشترک دو متغیر و ؛
  • : تابع مفصل؛
  • : تلبع تراکمی توزیع متغیر ؛
  • : تابع تراکمی توزیع متغیر ؛
  • : تابع چگالی احتمال متغیر ؛
  • : تابع چگالی احتمال متغیر .

در حالت کلی برای m متغیر تصادفی پیوسته   ، تابع توزیع تراکمی مشترک[64] که آن را با  نشان می دهیم به صورت زیر تعریف می‌شود :

(54) ,

که در آن: ، : پارامتر تابع مفصل.

که به این تابع توزیع تراکمی مشترک، تابع مفصل نیز گفته می‌شود.

تابع مفصل دو متغیره با پارامتر  دارای ویژگی­های زیر می‌باشد:

  1. اگر و  متغیرهای تصادفی با باشند داریم:
(55)
  1. اگر هر کدام از متغیرهای و  دارای کران بالایی برابر 1 باشند داریم:
(56)
  1. برای متغیرهای تصادفی مستقل و جدا از هم داریم :
(57)
  1. برای هر تابع مفصل دو متغیره کران بالا و پایینی وجود دارد (فرچت[65]، 1951):
 (58)

توابع مفصل در هیدرولوژی

توابع مفصل نخستین بار در علم آمار معرفی شد. استفاده از توابع مفصل درهیدرولوژی طی سالیان اخیر گسترش یافته است. توابع مفصل مهم و پرکاربردی که در هیدرولوژی برای ساختن توزیع­های احتمالاتی دو متغیره مختلط از آن ها استفاده می‌شود عبارتند از (لی و همکاران[66]، 2013):

  1. تابع مفصل کلایتون[67]
  2. تابع مفصل گامبل[68]
  3. تابع مفصل فرانک[69]
  4. تابع مفصل گوسین[70]

در ادامه به بررسی روابط موجود در هرکدام از این توابع پرداخته شده است.

تابع مفصل کلایتون

رابطه­ی تابع مفصل کلایتون به صورت زیر می‌باشد:

(58)

تابع چگالی احتمال کلایتون از رابطه­ی زیر محاسبه می‌شود:

(59)

تابع مفصل گامبل

رابطه­ی تابع مفصل گامبل به صورت زیر است:

(60)

تابع چگالی احتمال گامبل توسط رابطه­ی 61 محاسبه می‌شود:

(61)

تابع مفصل فرانک

تابع مفصل فرانک توسط رابطه­ی 62 بیان می‌شود:

(62)

تابع چگالی احتمال این تابع مفصل به صورت زیر است:

(63)

تابع مفصل گوسین

 

تابع مفصل گوسین توسط رابطه­ی 64 تعیین می‌شود:

(64)

 

تابع چگالی احتمال گوسین به صورت زیر است :

(65)

که در این روابط :

 

  • : متغیر تصادفی اول،
  • : متغیر تصادفی دوم،
  • : پارامتر تابع مفصل؛
  • : تابع توزیع تراکمی نرمال استاندارد؛
  • : تابع چگالی احتمال نرمال استاندارد.

توابع مفصل و پارامترهای خشکسالی

رابطه­ی تابع مفصل به­منظور مدل­سازی احتمالاتی دو گانه مخلتلط مشخصه‌های خشکسالی به صورت زیر است:

  • برای بزرگی (M) و مدت خشکسالی (D) از مدل احتمالاتی زیر که بر پایه تابع مفصل دو متغیره استوار است استفاده می‌شود:
(66)

که در آن:

  • : تابع توزیع تراکمی مختلط بزرگی و مدت خشکسالی؛
  • : تابع توزیع تراکمی مدت خشکسالی؛
  • : تابع توزیع تراکمی بزرگی خشکسالی؛
  • : تابع مفصل.
  • برای شدت (S) و مدت خشکسالی (D) از مدل احتمالاتی زیر با استفاده از تایع مفصل دو متغیره استفاده می‌شود:
(67)

که در آن:

  • : تابع توزیع تراکمی مختلط شدت و مدت خشکسالی؛
  • : تابع توزیع تراکمی مدت خشکسالی؛
  • : تابع توزیع تراکمی شدت خشکسالی؛
  • : تابع مفصل.

تعیین پارامتر و انتخاب تابع مفصل

برای برآورد پارمتر هر یک از توابع مفصل روش استنتاج تابع حاشیه­ها[71] و یا به اصطلاح روش IFM استفاده می‌شود. روش IFM در دو مرحله پارامتر یک تابع مفصل را برآورد می‌کند (لی و همکاران[72]، 2013):

  • ابتدا پارامترهای توابع توزیع تراکمی حاشیه ای ( و ) با استفاده از روش حداکثر درست نمایی[73] برآورد می‌شود؛
  • سپس تابع لگاریتم درست نمایی[74] تابع مفصل با استفاده از پارامترهای به­دست آمده از مرحله اول حداکثر می‌گردد تا بهترین مقدار پارامتر تابع مفصل به دست آید.

انتخاب تابع مفصل با توجه به پارامتر به­دست آمده برای تابع مفصل از روش IFM و مقدار لگاریتم درستنمایی صورت گیرد به­طوری که تابعی که دارای بیشترین مقدار لگاریتم درستنمایی می‌باشد به عنوان تابع مفصل برتر انتخاب می‌شود.

روش حد اکثر درست نمائی[75]

از این روش برای برآورد پارامترهای یک مدل احتمالاتی استفاده می‌شود. محاسبه­ی پارامترها در این روش بر پایه­ی بیشترین احتمال وقوع داده‌های مشاهداتی می‌باشد. برای یک توزیع مشخص با تابع چگالی احتمال  و پارامترهای .

تابع درست نمائی[76] L به صورت زیر تعریف می‌شود:

(68)

که در آن:

  • : تابع درست نمایی؛
  • ، پارامترهای تابع چگالی احتمال؛
  • : تابع چگالی احتمال یک توزیع دلخواه.

پارامترهای  که مقدار تابع درست نمائی را بیشینه می­کنند از رابطه زیر به­دست می آید:

(69)

در بیشتر مواقع برای سادگی کار، لگاریتم تابع درست نمائی محاسبه می شود و پارامتر­های مدل را نسبت به این لگاریتم درست نمائی به صورت زیر محاسبه می­کنیم:

  (70)

 

در این کتاب برای استفاده از توابع مفصل در مدل­سازی احتمالاتی مختلط پارامترهای خشکسالی، با استفاده از روش حداکثر درست نمائی پارامترهای توزیع های حاشیه­ای محاسبه شده و سپس با توجه به مقادیر بهینه­ی به­دست آمده از مرحله­ی قبل، پارامتر تابع مفصل و تابع درست نمائی آن جهت انتخاب تابع مفصل، به­دست آمده است.

 

تعداد صفحات

157

انتشارات

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

.فقط مشتریانی که این محصول را خریداری کرده اند و وارد سیستم شده اند میتوانند برای این محصول دیدگاه(نظر) ارسال کنند.