कॉलम मानों के आधार पर

Mia Chevalier

मंगलवार, 25 जून 2024 को 2:58:57 pm

पांडा डेटाफ़्रेम में पंक्तियों को फ़िल्टर करना
पांडास डेटा हेरफेर और विश्लेषण के लिए पायथन में एक शक्तिशाली पुस्तकालय है। एक सामान्य कार्य कॉलम मानों के आधार पर डेटाफ़्रेम से पंक्तियों का चयन करना है, SQL के SELECT * FROM Table WHERE column_name = some_value के समान।
यह मार्गदर्शिका आपको पांडा में इसे प्राप्त करने के विभिन्न तरीकों के बारे में बताएगी, जिससे आपके डेटा को कुशलतापूर्वक फ़िल्टर करना आसान हो जाएगा। चाहे आप शुरुआती हों या अनुभवी उपयोगकर्ता, ये युक्तियाँ आपके डेटा प्रबंधन कौशल को बढ़ाएंगी।

आज्ञा विवरण

pd.DataFrame(data) डेटा के शब्दकोश से डेटाफ़्रेम बनाता है।

df[column_name] डेटाफ़्रेम में किसी कॉलम को नाम से एक्सेस करता है।

df[condition] किसी कॉलम पर लागू शर्त के आधार पर डेटाफ़्रेम को फ़िल्टर करता है।

print(selected_rows) डेटाफ़्रेम या उसके उपसमूह को कंसोल पर प्रिंट करता है।

df[df['Age'] >df[df['Age'] > 25] उन पंक्तियों का चयन करता है जहां 'आयु' कॉलम मान 25 से अधिक हैं।

df[df['City'] == 'Chicago'] उन पंक्तियों का चयन करता है जहां 'शहर' कॉलम मान 'शिकागो' के बराबर हैं।

आज्ञा	विवरण
pd.DataFrame(data)	डेटा के शब्दकोश से डेटाफ़्रेम बनाता है।
df[column_name]	डेटाफ़्रेम में किसी कॉलम को नाम से एक्सेस करता है।
df[condition]	किसी कॉलम पर लागू शर्त के आधार पर डेटाफ़्रेम को फ़िल्टर करता है।
print(selected_rows)	डेटाफ़्रेम या उसके उपसमूह को कंसोल पर प्रिंट करता है।
df[df['Age'] >df[df['Age'] > 25]	उन पंक्तियों का चयन करता है जहां 'आयु' कॉलम मान 25 से अधिक हैं।
df[df['City'] == 'Chicago']	उन पंक्तियों का चयन करता है जहां 'शहर' कॉलम मान 'शिकागो' के बराबर हैं।

पंडों में डेटाफ़्रेम पंक्ति चयन को समझना

प्रदान की गई स्क्रिप्ट दर्शाती है कि पायथन में पांडा लाइब्रेरी का उपयोग करके कॉलम मानों के आधार पर डेटाफ़्रेम से पंक्तियों का चयन कैसे किया जाए। पहली स्क्रिप्ट पंडों की लाइब्रेरी को आयात करने से शुरू होती है आज्ञा। इसके बाद यह डेटा के शब्दकोश का उपयोग करके एक नमूना डेटाफ़्रेम बनाता है, जिसे डेटाफ़्रेम में परिवर्तित किया जाता है आज्ञा। फिर स्क्रिप्ट पंक्ति चयन के लिए दो तरीकों को दर्शाती है: उन पंक्तियों का चयन करना जहां 'आयु' कॉलम का मान 25 से अधिक है , और उन पंक्तियों का चयन करना जहां 'शहर' कॉलम मान 'शिकागो' का उपयोग कर रहा है df[df['City'] == 'Chicago']. ये फ़िल्टर किए गए डेटाफ़्रेम का उपयोग करके मुद्रित किए जाते हैं चयनित पंक्तियों को प्रदर्शित करने का कार्य।

दूसरी स्क्रिप्ट एक समान संरचना का अनुसरण करती है लेकिन विभिन्न डेटा और चयन मानदंडों का उपयोग करती है। यह 'उत्पाद', 'मूल्य' और 'स्टॉक' कॉलम सहित उत्पाद जानकारी के साथ एक डेटाफ़्रेम बनाता है। पंक्तियों का चयन वहां किया जाता है जहां 'मूल्य' 200 से कम या उसके बराबर है

पांडा में डेटाफ़्रेम पंक्तियों के चयन के लिए उन्नत तकनीकें

बूलियन इंडेक्सिंग का उपयोग करके बुनियादी फ़िल्टरिंग के अलावा, पांडा कॉलम मानों के आधार पर पंक्तियों का चयन करने के लिए उन्नत तकनीक प्रदान करता है। एक शक्तिशाली विधि का उपयोग कर रहा है फ़ंक्शन, जो आपको क्वेरी अभिव्यक्ति के साथ पंक्तियों को फ़िल्टर करने की अनुमति देता है, जिससे सिंटैक्स क्लीनर और अक्सर अधिक सहज हो जाता है। उदाहरण के लिए, उपयोग करने के बजाय , आप लिख सकते हो . यह विधि विशेष रूप से तब उपयोगी होती है जब अधिक जटिल परिस्थितियों से निपटते समय या जब स्तंभ नामों में रिक्त स्थान होते हैं। इसके अतिरिक्त, isin() जब आप मानों की सूची के आधार पर पंक्तियों को फ़िल्टर करना चाहते हैं तो फ़ंक्शन फायदेमंद होता है। उदाहरण के लिए, उन पंक्तियों का चयन करने के लिए जहां 'शहर' कॉलम मान या तो 'शिकागो' या 'न्यूयॉर्क' है, आप इसका उपयोग कर सकते हैं .

एक अन्य तकनीक में शामिल है और अनुक्रमणिका. इंडेक्सर लेबल-आधारित है, जो आपको पंक्ति लेबल और कॉलम नामों के आधार पर पंक्तियों का चयन करने की अनुमति देता है iloc पूर्णांक-स्थान-आधारित है, जो पंक्ति और स्तंभ संख्याओं द्वारा चयन को सक्षम बनाता है। यह लचीलापन किसी भिन्न कॉलम पर लागू शर्त के आधार पर पंक्तियों का चयन करने के लिए विशेष रूप से उपयोगी है। उदाहरण के लिए, 25 वर्ष से अधिक उम्र के व्यक्तियों के नाम वापस कर देगा। ये विधियां पांडा में डेटा को कुशलतापूर्वक संभालने और विश्लेषण करने के लिए आपके टूलकिट का विस्तार करती हैं, और अधिक पठनीय और रखरखाव योग्य कोड प्रदान करती हैं।

मैं अनेक स्थितियों के आधार पर पंक्तियों का चयन कैसे कर सकता हूँ?
आप इसका उपयोग कर सकते हैं जैसे तार्किक ऑपरेटरों के साथ कार्य करना या शर्तों को संयोजित करना और . उदाहरण के लिए, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
क्या मैं मानों की सूची के आधार पर पंक्तियों को फ़िल्टर कर सकता हूँ?
हाँ, उपयोग करें समारोह। उदाहरण के लिए, .
के बीच क्या अंतर है और ?
जबकि, लेबल-आधारित है पूर्णांक-स्थान-आधारित है। उपयोग पंक्ति/स्तंभ लेबल के साथ और iloc पंक्ति/स्तंभ सूचकांकों के साथ।
पंक्तियों को फ़िल्टर करते समय मैं विशिष्ट कॉलम कैसे चुन सकता हूँ?
आप उपयोग कर सकते हैं . उदाहरण के लिए, .
पंक्तियों का चयन करते समय मैं लुप्त मानों को कैसे संभालूँ?
उपयोग लुप्त मानों वाली पंक्तियों को हटाने का कार्य, या उन्हें एक निर्दिष्ट मान से बदलने के लिए।
क्या मैं पंक्तियों को फ़िल्टर करने के लिए रेगुलर एक्सप्रेशन का उपयोग कर सकता हूँ?
हां के साथ कार्य करें पैरामीटर आपको रेगेक्स पैटर्न के आधार पर पंक्तियों को फ़िल्टर करने की अनुमति देता है। उदाहरण के लिए, .
मैं अनुक्रमणिका के आधार पर पंक्तियों को कैसे फ़िल्टर करूं?
आप उपयोग कर सकते हैं सूचकांक नाम के साथ. उदाहरण के लिए, .
यदि मेरे कॉलम नामों में रिक्त स्थान या विशेष वर्ण हों तो क्या होगा?
उपयोग फ़ंक्शन जो ऐसे कॉलम नामों को बैकटिक्स के साथ संभाल सकता है। उदाहरण के लिए, .

डेटाफ़्रेम पंक्ति चयन तकनीकों पर अंतिम विचार

पांडा में कॉलम मानों के आधार पर डेटाफ़्रेम से पंक्तियों का चयन करना डेटा हेरफेर के लिए एक महत्वपूर्ण कौशल है। बूलियन इंडेक्सिंग सहित विभिन्न तरीकों पर चर्चा की गई, , , और लेबल-आधारित और पूर्णांक-स्थान-आधारित अनुक्रमण और iloc, डेटा को कुशलतापूर्वक फ़िल्टर करने के लिए शक्तिशाली उपकरण प्रदान करें। इन तकनीकों की महारत बेहतर डेटा विश्लेषण और स्वच्छ, अधिक रखरखाव योग्य कोड को सक्षम बनाती है।

कॉलम मानों के आधार पर पांडा डेटाफ़्रेम में पंक्तियों को कैसे फ़िल्टर करें

पंडों में डेटाफ़्रेम पंक्ति चयन को समझना

पांडा में डेटाफ़्रेम पंक्तियों के चयन के लिए उन्नत तकनीकें

डेटाफ़्रेम पंक्ति चयन तकनीकों पर अंतिम विचार