एक्सेल में आउटकैलर्स फ़ंक्शन का उपयोग कैसे और क्यों करें
एक आउटलाइयर एक मान है जो आपके डेटा के अधिकांश मानों की तुलना में काफी अधिक या कम है। डेटा का विश्लेषण करने के लिए एक्सेल का उपयोग करते समय, आउटलेयर परिणाम को तिरछा कर सकते हैं। उदाहरण के लिए, डेटा सेट का औसत औसत वास्तव में आपके मूल्यों को प्रतिबिंबित कर सकता है। एक्सेल आपके आउटलेर्स को प्रबंधित करने में मदद करने के लिए कुछ उपयोगी कार्य प्रदान करता है, तो आइए एक नज़र डालते हैं.
एक त्वरित उदाहरण
नीचे दी गई छवि में, आउटलेयर यथोचित रूप से आसान हैं-दो को एरिक को सौंपा गया और रयान को सौंपा गया 173 का मूल्य। इस तरह से सेट किए गए डेटा में, उन आउटलेर्स को मैन्युअल रूप से स्पॉट और डील करना काफी आसान है.
डेटा के एक बड़े सेट में, ऐसा नहीं होगा। बाहरी लोगों की पहचान करने और उन्हें सांख्यिकीय गणना से हटाने में सक्षम होना महत्वपूर्ण है-और यही हम इस लेख में कैसे करना है.
अपने डेटा में आउटलेयर कैसे खोजें
डेटा सेट में आउटलेयर को खोजने के लिए, हम निम्नलिखित चरणों का उपयोग करते हैं:
- 1 और 3 चतुर्थांश की गणना करें (हम उन चीजों के बारे में बात करेंगे जो थोड़े से हैं).
- इंटरक्वेर्टाइल रेंज का मूल्यांकन करें (हम इनको थोड़ा और नीचे समझाएंगे).
- हमारी डेटा श्रेणी की ऊपरी और निचली सीमाएँ लौटाएँ.
- इन सीमाओं का उपयोग आउटलाइंग डेटा बिंदुओं की पहचान करने के लिए करें.
नीचे दी गई छवि में देखे गए डेटा सेट के दाईं ओर स्थित सेल रेंज का उपयोग इन मूल्यों को संग्रहीत करने के लिए किया जाएगा.
आएँ शुरू करें.
एक कदम: चौकड़ी की गणना
यदि आप अपने डेटा को क्वार्टर में विभाजित करते हैं, तो उनमें से प्रत्येक सेट को क्वार्टराइल कहा जाता है। श्रेणी में सबसे कम 25% संख्या 1 चतुर्थक, अगले 25% 2 चतुर्थक, और इसी तरह से बनती है। हम यह कदम पहले उठाते हैं क्योंकि एक बाहरी रूप से सबसे व्यापक रूप से इस्तेमाल की जाने वाली परिभाषा एक डेटा बिंदु है जो 1 चौथाई गेलन से नीचे 1.5 इंटरक्वेर्टाइल रेंज (आईक्यूआर), और 3 क्वार्टराइल के ऊपर 1.5 इंटरक्विटरल रेंज है। उन मूल्यों को निर्धारित करने के लिए, हमें पहले यह पता लगाना होगा कि चौकड़ी क्या है.
एक्सेल चतुर्थकों की गणना करने के लिए एक क्विल्टाइल फ़ंक्शन प्रदान करता है। यह जानकारी के दो टुकड़ों की आवश्यकता है: सरणी और क्वार्ट.
= QUARTILE (सरणी, क्वार्ट)
सरणी उन मूल्यों की श्रेणी है जिनका आप मूल्यांकन कर रहे हैं। और यह चौथाई गेलन एक संख्या है जो उस चतुर्थक का प्रतिनिधित्व करती है जिसे आप वापस करना चाहते हैं (जैसे, 1 के लिए 1सेंट चतुर्थक, 2 चतुर्थांश के लिए 2, और इसी तरह).
ध्यान दें: Excel 2010 में, Microsoft ने QUARTILE.INC और QUARTILE.EXC फ़ंक्शन को QUARTILE फ़ंक्शन में सुधार के रूप में जारी किया। Excel के कई संस्करणों में काम करने पर QUARTILE अधिक पिछड़ा संगत है.
आइए हमारे उदाहरण तालिका पर वापस लौटें.
1 की गणना के लिएसेंट चतुर्थांश हम सेल F2 में निम्नलिखित सूत्र का उपयोग कर सकते हैं.
= चतुर्थक (B2: B14,1)
जैसे ही आप सूत्र में प्रवेश करते हैं, एक्सेल क्वार्ट तर्क के लिए विकल्पों की एक सूची प्रदान करता है.
3 की गणना करने के लिएतृतीय चतुर्थक, हम सेल F3 में पिछले एक की तरह एक सूत्र दर्ज कर सकते हैं, लेकिन एक के बजाय तीन का उपयोग कर सकते हैं.
= चतुर्थक (B2: B14,3)
अब, हमें कोशिकाओं में प्रदर्शित चतुर्थक डेटा बिंदु मिल गए हैं.
चरण दो: इंटरक्वेर्टाइल रेंज का मूल्यांकन करें
इंटरक्वेर्टाइल रेंज (या IQR) आपके डेटा में मूल्यों का मध्य 50% है। यह 1 चतुर्थक मान और 3 चतुर्थक मान के बीच अंतर के रूप में गणना की जाती है.
हम सेल F4 में एक सरल सूत्र का उपयोग करने जा रहे हैं जो 1 को घटाता हैसेंट 3 से चतुर्थकतृतीय चतुर्थक:
= F3-F2
अब, हम अपनी इंटरक्वेर्टाइल रेंज प्रदर्शित कर सकते हैं.
चरण तीन: लोअर और अपर बाउंड्स लौटाएं
निचले और ऊपरी सीमा डेटा रेंज के सबसे छोटे और सबसे बड़े मूल्य हैं जो हम उपयोग करना चाहते हैं। इन बाध्य मूल्यों से छोटा या बड़ा कोई भी मूल्य आउटलेर हैं.
हम सेल F5 में निचली सीमा की गणना IQR मान को 1.5 से गुणा करके और फिर Q1 डेटा बिंदु से घटाकर करेंगे:
= F2- (1.5 * F4)
ध्यान दें: इस सूत्र में कोष्ठक आवश्यक नहीं हैं क्योंकि गुणा भाग घटाव भाग से पहले गणना करेगा, लेकिन वे सूत्र को पढ़ने में आसान बनाते हैं.
सेल F6 में ऊपरी सीमा की गणना करने के लिए, हम IQR को फिर से 1.5 से गुणा करेंगे, लेकिन इस बार जोड़ना यह Q3 डेटा बिंदु के लिए:
= F3 + (1.5 * F4)
चरण चार: आउटलेर्स की पहचान करें
अब जब हमने अपने सभी अंतर्निहित डेटा को सेट कर लिया है, तो यह हमारे आउटलाइंग डेटा बिंदुओं की पहचान करने का समय है-जो कि कम बाउंड वैल्यू से कम या ऊपरी बाउंड वैल्यू से अधिक है।.
हम इस तार्किक परीक्षण को करने के लिए OR फ़ंक्शन का उपयोग करेंगे और निम्न मानों को पूरा करने वाले मानों को सेल C2 में निम्न सूत्र में दर्ज करके दिखाएंगे:
= या (बी 2 $ F $ 6)
फिर हम उस मूल्य को हमारी C3-C14 कोशिकाओं में कॉपी करेंगे। TRUE मान बाह्य रूप से इंगित करता है, और जैसा कि आप देख सकते हैं, हमने अपने डेटा में दो प्राप्त किए हैं.
औसत औसत की गणना करते समय आउटलेर्स की उपेक्षा करना
QUARTILE फ़ंक्शन का उपयोग करके हम IQR की गणना करते हैं और एक बाहरी रूप से सबसे व्यापक रूप से उपयोग की जाने वाली परिभाषा के साथ काम करते हैं। हालांकि, मूल्यों की एक सीमा के लिए औसत औसत की गणना करते समय और आउटलेयर को अनदेखा करने के लिए, उपयोग करने के लिए एक तेज और आसान फ़ंक्शन है। यह तकनीक पहले की तरह एक बाहरी स्थिति की पहचान नहीं करेगी, लेकिन यह हमें अपने लचीले हिस्से के साथ लचीला होने की अनुमति देगा.
हमें जिस फ़ंक्शन की आवश्यकता होती है उसे TRIMMEAN कहा जाता है, और आप इसके लिए सिंटैक्स देख सकते हैं:
= TRIMMEAN (सरणी, प्रतिशत)
सरणी उन मूल्यों की श्रेणी है जिन्हें आप औसत करना चाहते हैं। प्रतिशत डेटा सेट के ऊपर और नीचे से डेटा बिंदुओं का प्रतिशत है (आप इसे प्रतिशत या दशमलव मान के रूप में दर्ज कर सकते हैं).
हमने औसत की गणना करने और आउटलेर्स के 20% को बाहर करने के लिए हमारे उदाहरण में सेल डी 3 में नीचे सूत्र में प्रवेश किया.
= TRIMMEAN (B2: B14, 20%)
वहाँ आपके पास आउटलेर से निपटने के लिए दो अलग-अलग कार्य हैं। चाहे आप उन्हें कुछ रिपोर्टिंग जरूरतों के लिए पहचानना चाहते हैं या उन्हें औसत से गणना से बाहर करना चाहते हैं, एक्सेल में आपकी आवश्यकताओं को पूरा करने के लिए एक फ़ंक्शन है.