पांडा डेटाफ्रेममध्ये पंक्ती फिल्टर करणे
डेटा मॅनिपुलेशन आणि विश्लेषणासाठी Python मध्ये Pandas ही एक शक्तिशाली लायब्ररी आहे. कॉलम व्हॅल्यूवर आधारित डेटाफ्रेममधून पंक्ती निवडणे हे एक सामान्य कार्य आहे, SQL च्या SELECT * FROM टेबल WHERE column_name = some_value प्रमाणेच.
हे मार्गदर्शक तुम्हाला पांडामध्ये हे साध्य करण्यासाठी विविध पद्धतींमधून मार्गदर्शन करेल, ज्यामुळे तुमचा डेटा कार्यक्षमतेने फिल्टर करणे सोपे होईल. तुम्ही नवशिक्या असाल किंवा अनुभवी वापरकर्ता असाल, या टिपा तुमचे डेटा हाताळण्याचे कौशल्य वाढवतील.
आज्ञा | वर्णन |
---|---|
pd.DataFrame(data) | डेटाच्या शब्दकोशातून डेटाफ्रेम तयार करते. |
df[column_name] | DataFrame मध्ये नावाने कॉलम ऍक्सेस करते. |
df[condition] | कॉलमवर लागू केलेल्या अटीवर आधारित डेटाफ्रेम फिल्टर करते. |
print(selected_rows) | कन्सोलवर डेटाफ्रेम किंवा त्याचा उपसंच मुद्रित करते. |
df[df['Age'] >df[df['Age'] > 25] | पंक्ती निवडते जेथे 'वय' स्तंभ मूल्ये 25 पेक्षा जास्त आहेत. |
df[df['City'] == 'Chicago'] | पंक्ती निवडते जेथे 'शहर' स्तंभ मूल्ये 'शिकागो' प्रमाणे असतात. |
पांडामधील डेटाफ्रेम पंक्ती निवड समजून घेणे
प्रदान केलेल्या स्क्रिप्ट्स Python मधील Pandas लायब्ररी वापरून कॉलम व्हॅल्यूवर आधारित डेटाफ्रेममधून पंक्ती कशा निवडायच्या हे दाखवतात. पहिल्या स्क्रिप्टची सुरुवात पांडस लायब्ररी सह आयात करून होते आज्ञा ते नंतर डेटाचा शब्दकोश वापरून नमुना डेटाफ्रेम तयार करते, जे डेटाफ्रेममध्ये रूपांतरित होते आज्ञा स्क्रिप्ट नंतर पंक्ती निवडीसाठी दोन पद्धती दर्शवते: जेथे 'वय' स्तंभाचे मूल्य 25 पेक्षा जास्त असेल अशा पंक्ती निवडणे , आणि पंक्ती निवडणे जेथे 'शहर' स्तंभाचे मूल्य 'शिकागो' आहे df[df['City'] == 'Chicago']. हे फिल्टर केलेले डेटाफ्रेम वापरून मुद्रित केले जातात निवडलेल्या पंक्ती प्रदर्शित करण्यासाठी कार्य.
दुसरी स्क्रिप्ट सारख्याच संरचनेचे अनुसरण करते परंतु भिन्न डेटा आणि निवड निकष वापरते. हे 'उत्पादन', 'किंमत' आणि 'स्टॉक' स्तंभांसह उत्पादन माहितीसह डेटाफ्रेम तयार करते. जेथे 'किंमत' 200 पेक्षा कमी किंवा समान असेल तेथे पंक्ती निवडल्या जातात , आणि जेथे 'स्टॉक' चा वापर 40 पेक्षा जास्त आहे . या स्क्रिप्ट्सचा उद्देश विशिष्ट परिस्थितींवर आधारित डेटाफ्रेम पंक्ती कशा फिल्टर करायच्या हे दाखवणे हा आहे, जसे की तुम्ही स्तंभ मूल्यावर आधारित टेबलमधून पंक्ती निवडण्यासाठी SQL क्वेरी कशी वापरता. या आज्ञा समजून घेऊन आणि लागू करून, तुम्ही तुमच्या डेटाफ्रेममधील डेटा कुशलतेने हाताळू शकता आणि त्याचे विश्लेषण करू शकता.
पांडामधील स्तंभ मूल्ये वापरून डेटाफ्रेममधील पंक्ती निवडणे
पांडा लायब्ररीसह पायथन
# Importing the necessary library
import pandas as pd
# Creating a sample DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'Age': [24, 27, 22, 32, 29],
'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']
}
df = pd.DataFrame(data)
# Selecting rows where Age is greater than 25
selected_rows = df[df['Age'] > 25]
print(selected_rows)
# Selecting rows where City is 'Chicago'
chicago_rows = df[df['City'] == 'Chicago']
print(chicago_rows)
कॉलम निकषांवर आधारित डेटाफ्रेममध्ये डेटा फिल्टर करणे
पांडा लायब्ररीसह पायथन
१
पांडामध्ये डेटाफ्रेम पंक्ती निवडण्यासाठी प्रगत तंत्रे
बुलियन इंडेक्सिंग वापरून मूलभूत फिल्टरिंग व्यतिरिक्त, पांडा स्तंभ मूल्यांवर आधारित पंक्ती निवडण्यासाठी प्रगत तंत्रे ऑफर करते. एक शक्तिशाली पद्धत वापरत आहे फंक्शन, जे तुम्हाला क्वेरी अभिव्यक्तीसह पंक्ती फिल्टर करण्यास अनुमती देते, वाक्यरचना क्लीनर बनवते आणि बरेचदा अधिक अंतर्ज्ञानी बनते. उदाहरणार्थ, वापरण्याऐवजी , तुम्ही लिहू शकता . अधिक जटिल परिस्थिती हाताळताना किंवा स्तंभाच्या नावांमध्ये मोकळी जागा असताना ही पद्धत विशेषतः उपयुक्त आहे. याव्यतिरिक्त, द isin() जेव्हा तुम्ही मूल्यांच्या सूचीवर आधारित पंक्ती फिल्टर करू इच्छित असाल तेव्हा फंक्शन फायदेशीर आहे. उदाहरणार्थ, जेथे 'शहर' स्तंभाचे मूल्य एकतर 'शिकागो' किंवा 'न्यू यॉर्क' असेल अशा पंक्ती निवडण्यासाठी, तुम्ही वापरू शकता .
आणखी एक तंत्र समाविष्ट आहे आणि निर्देशांक द इंडेक्सर हे लेबल-आधारित आहे, जे तुम्हाला पंक्ती लेबले आणि स्तंभांच्या नावांवर आधारित पंक्ती निवडण्याची परवानगी देते, तर iloc पूर्णांक-स्थान-आधारित आहे, पंक्ती आणि स्तंभ क्रमांकांनुसार निवड सक्षम करते. ही लवचिकता विशेषतः वेगळ्या स्तंभावर लागू केलेल्या अटीवर आधारित पंक्ती निवडण्यासाठी उपयुक्त आहे. उदाहरणार्थ, 25 पेक्षा जास्त वयाच्या व्यक्तींची नावे परत करतील. या पद्धती पांडामधील डेटा कार्यक्षमतेने हाताळण्यासाठी आणि विश्लेषित करण्यासाठी तुमची टूलकिट विस्तृत करतात, अधिक वाचनीय आणि देखरेख करण्यायोग्य कोड ऑफर करतात.
- मी अनेक अटींवर आधारित पंक्ती कशी निवडू शकतो?
- आपण वापरू शकता फंक्शन किंवा लॉजिकल ऑपरेटरसह परिस्थिती एकत्र करा आणि . उदाहरणार्थ, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
- मी मूल्यांच्या सूचीवर आधारित पंक्ती फिल्टर करू शकतो?
- होय, वापरा कार्य उदाहरणार्थ, .
- यांच्यात काय फरक आहे आणि ?
- लेबल-आधारित आहे, तर पूर्णांक-स्थान-आधारित आहे. वापरा पंक्ती/स्तंभ लेबलांसह आणि iloc पंक्ती/स्तंभ निर्देशांकांसह.
- पंक्ती फिल्टर करताना मी विशिष्ट स्तंभ कसे निवडू शकतो?
- तुम्ही वापरू शकता . उदाहरणार्थ, .
- पंक्ती निवडताना मी हरवलेली मूल्ये कशी हाताळू?
- वापरा गहाळ मूल्यांसह पंक्ती काढण्यासाठी फंक्शन, किंवा त्यांना निर्दिष्ट मूल्यासह पुनर्स्थित करण्यासाठी.
- पंक्ती फिल्टर करण्यासाठी मी रेग्युलर एक्सप्रेशन वापरू शकतो का?
- होय, द सह कार्य करा पॅरामीटर तुम्हाला रेजेक्स पॅटर्नवर आधारित पंक्ती फिल्टर करण्याची परवानगी देतो. उदाहरणार्थ, .
- मी निर्देशांकावर आधारित पंक्ती कशा फिल्टर करू?
- तुम्ही वापरू शकता अनुक्रमणिका नावासह. उदाहरणार्थ, .
- माझ्या स्तंभाच्या नावांमध्ये स्पेस किंवा विशेष वर्ण असल्यास?
- वापरा फंक्शन जे अशा कॉलमची नावे बॅकटिकसह हाताळू शकते. उदाहरणार्थ, .
डेटाफ्रेम पंक्ती निवड तंत्रावरील अंतिम विचार
पांडामधील कॉलम व्हॅल्यूवर आधारित डेटाफ्रेममधून पंक्ती निवडणे हे डेटा मॅनिपुलेशनसाठी एक महत्त्वपूर्ण कौशल्य आहे. बुलियन इंडेक्सिंगसह चर्चा केलेल्या विविध पद्धती, , , आणि यासह लेबल-आधारित आणि पूर्णांक-स्थान-आधारित अनुक्रमणिका आणि iloc, डेटा कार्यक्षमतेने फिल्टर करण्यासाठी शक्तिशाली साधने प्रदान करा. या तंत्रांचे प्रभुत्व चांगले डेटा विश्लेषण आणि स्वच्छ, अधिक देखभाल करण्यायोग्य कोड सक्षम करते.