بیانیه ای که یکی از مشترکین ExcelTips (چاک) در پاسخ به سؤال Help Wanted بیان کرد، نظرات جالب بسیاری از دیگر مشترکین ExcelTips را برانگیخت . چاک بیان کرد که از نظر آماری، مقدار 0.5 باید نیمی از زمان را به سمت بالا و در نیمی دیگر از زمان را پایین بیاورد زیرا دقیقاً در وسط دو مقدار کامل قرار دارد. این قیاس ارائه شد که اگر توپ تنیس روی توری متعادل بود، از نظر آماری توپ باید نیمی از زمان به چپ و نیمی دیگر از زمان به راست بیفتد.
به نظر می رسد که احساسات شدیدی در مورد چنین اظهاراتی حتی در بین سایر آمارگیران وجود دارد. (به نظر میرسد همه رشتهها جنگهای مذهبی مختلف خود را دارند که در آن احساسات زیاد است.) همانطور که یکی از خبرنگاران اشاره کرد، این مشکل «نردههای قدیمی در مقابل میلههای حصار در شمارش فواصل بین اعداد» است. بحث این است که وقتی چیزی درست روی یک میله حصار قرار بگیرد، کجا می افتد. مشکل قیاس توپ تنیس و تور (یا حصارها و تیرهای حصار) این است که تور در وسط زمین تنها خط جداکننده دقیق نیست.
به عنوان مثال، اجازه دهید بگوییم که انتهای سمت چپ زمین تنیس دارای یک خط با علامت "4.0" و انتهای دیگر دارای یک خط با علامت "5.0" است. این به این معنی است که شبکه با "4.5" مشخص شده است. در حالی که یک توپ تنیس می تواند روی علامت 4.5 تعادل داشته باشد و در هر طرف بیفتد، از نظر تئوری توپ همچنین می تواند روی خط در هر دو انتهای زمین تعادل داشته باشد (4.0 و 5.0) و همچنین از هر طرف خارج شود.
یکی از خبرنگاران این احساس را بیان کرد که گرد کردن 0.5 به بالا یا پایین (نیمی از یک راه و نیمی دیگر) نامناسب است زیرا سوگیری را در داده ها وارد می کند. موقعیتی را در نظر بگیرید که در آن با یک رقم در سمت راست نقطه اعشار سروکار دارید: شما اعداد 7.0، 7.1، 7.2 و غیره را تا 7.9 دارید. هنگام گرد کردن این ارقام، پنج مقدار همیشه به سمت پایین گرد می شوند (7.0 تا 7.4)، یک مقدار می تواند به هر طرف گرد شود (7.5)، و چهار مقدار همیشه به سمت بالا گرد می شوند (7.6 تا 7.9). به عبارت دیگر، با گذشت زمان 5.5 مقدار به پایین و 4.5 مقدار به بالا گرد می شود. در کاربرد واقعی احتمال آماری، 5 مقدار باید به سمت پایین و 5 مقدار به بالا گرد شوند، اما "وافلینگ" مقدار مرکزی (7.5) یک سوگیری به نفع گرد کردن به پایین و علیه گرد کردن به بالا ایجاد می کند.
بنابراین، کدام نظریه گرد کردن صحیح است؟ آیا 7.5 باید نیمی از زمان را گرد کند و نیمی از زمان را پایین بیاورد یا همیشه باید گرد شود؟ بدیهی است که مایکروسافت تصمیم خود را گرفته است، همانطور که همیشه 7.5 به بالا می رسد (توپ تنیس همیشه برای مقادیر مثبت به سمت راست و برای مقادیر منفی به سمت چپ می افتد). آیا تصمیم مایکروسافت به این معنی است که همیشه گرد کردن 0.5 صحیح است؟ موقعیت شما در جنگ مذهبی، پاسخ شما را مشخص خواهد کرد.
خوب، شاید یک نقطه داده دیگر کمک کند. به نظر می رسد که یک استاندارد ANSI برای کل این موضوع وجود دارد. یکی از مشترکین نشان داد که همیشه از استانداردهای ASTM E29 و ANSI Z25.1 پیروی کرده است، که هر دو مشخص میکنند که مقدار کسری دقیق 0.5 باید به نزدیکترین عدد که به رقم زوج ختم میشود گرد شود. اگر نیاز به انجام این نوع گرد کردن دارید، فرمول مناسب برای استفاده این است:
=IF(A1-INT(A1)-0.5,EVEN(ROUNDDOWN(A1,0)),ROUND(A1,0))
برای اینکه ببینم چگونه این میتواند بر نتیجه گرد کردن تأثیر بگذارد، مجموعهای از 25000 عدد تصادفی بین 1 تا 100 را ایجاد کردم که هر نتیجه تا دو رقم اعشار داشت. سپس با استفاده از تابع ROUND معمولی در یک ستون، مقادیر را به یک مقدار کامل گرد کردم و در ستون بعدی اعداد را با استفاده از فرمول بالا گرد کردم. سپس هر ستون را جمعبندی کردم تا ببینم کدام روش گرد کردن نتایجی نزدیکتر به مجموع اصلی دارد. در آزمون من، با استفاده از فرمول بالا به جای تابع Excels ROUND، نتایج بیش از 50٪ به مجموع اصلی نزدیکتر بود.
سپس 25000 عدد تصادفی با حداکثر سه رقم اعشار تولید کردم و نتایج یکسان بود - فرمول از یک ROUND عمومی نزدیکتر بود. همین امر در مورد اعداد چهار و پنج رقم اعشار نیز صادق است.
نکتهای که در آزمایش خود متوجه شدم این بود که در اولین مجموعه دادههای آزمون (اعداد تصادفی با حداکثر دو رقم اعشار) 234 مقدار وجود داشت که دقیقاً با معیارهای دقیقاً 5/0 مطابقت داشتند (و بنابراین برای گرد کردن به بالا یا پایین واجد شرایط بودند. ). در لیست با سه رقم اعشار تعداد منطبقات به 14 مقدار کاهش یافت، با چهار رقم اعشار 2 مقدار و با پنج رقم اعشار 0 مقدار بود. منطقی است که هرچه مقادیر کمتری وجود داشته باشد که معیارهای پایان دادن به 0.5 را برآورده کند، نیاز کمتری به اعمال منطق "گرد به بالا یا پایین" وجود دارد. بنابراین، فرمول گرد کردن، کارایی خود را زمانی از دست می دهد که با اعدادی که دارای چهار، پنج، شش یا بیشتر در سمت راست نقطه اعشار هستند، به دلیل وجود تطابق با مرکز دقیق، کار خود را از دست می دهند.
هر بحثی در مورد گرد کردن، البته، باید فرض کنیم که شما مقادیر خام را گرد می کنید، نه مقادیر قبلاً گرد شده. به عنوان مثال، اگر یک مقدار خام 14.46 باشد و شما آن را به 14.5 گرد کنید، دور بعدی 14.5 به 15 نادرست است. روش صحیح این است که 14.46 اصلی را بررسی کنید، که باید به سمت پایین گرد شود، به 14. بنابراین، شما همیشه باید از ROUND به عنوان یکی از آخرین مراحل خود در کار با اعداد استفاده کنید، نه به عنوان یکی از اولین مراحل. این بدان معناست که هنگام استفاده از توابع تجمعی، مانند SUM یا AVERAGE، نباید آنها را روی مقادیری که قبلاً گرد شده اند اعمال کنید. درعوض، باید مقادیر خام را SUM یا AVERAGE کنید و سپس گرد کردن را روی SUM یا AVERAGE انجام دهید. با یادآوری این نکته نتایج دقیق تری دریافت خواهید کرد.