ಪಾಂಡಾಸ್ ಡೇಟಾಫ್ರೇಮ್ಗಳಲ್ಲಿ ಸಾಲುಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲಾಗುತ್ತಿದೆ
ಡೇಟಾ ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್ ಮತ್ತು ವಿಶ್ಲೇಷಣೆಗಾಗಿ Pandas ಪೈಥಾನ್ನಲ್ಲಿ ಪ್ರಬಲ ಗ್ರಂಥಾಲಯವಾಗಿದೆ. ಸಾಮಾನ್ಯ ಕಾರ್ಯವೆಂದರೆ ಕಾಲಮ್ ಮೌಲ್ಯಗಳನ್ನು ಆಧರಿಸಿ ಡೇಟಾಫ್ರೇಮ್ನಿಂದ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡುವುದು, SQL ನ SELECT * ಟೇಬಲ್ನಿಂದ ಎಲ್ಲಿ ಕಾಲಮ್_ಹೆಸರು = some_value.
ಈ ಮಾರ್ಗದರ್ಶಿಯು ಪಾಂಡಾಗಳಲ್ಲಿ ಇದನ್ನು ಸಾಧಿಸಲು ವಿವಿಧ ವಿಧಾನಗಳ ಮೂಲಕ ನಿಮ್ಮನ್ನು ಕರೆದೊಯ್ಯುತ್ತದೆ, ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಫಿಲ್ಟರ್ ಮಾಡುವುದನ್ನು ಸುಲಭಗೊಳಿಸುತ್ತದೆ. ನೀವು ಹರಿಕಾರರಾಗಿರಲಿ ಅಥವಾ ಅನುಭವಿ ಬಳಕೆದಾರರಾಗಿರಲಿ, ಈ ಸಲಹೆಗಳು ನಿಮ್ಮ ಡೇಟಾ ನಿರ್ವಹಣೆ ಕೌಶಲ್ಯಗಳನ್ನು ಹೆಚ್ಚಿಸುತ್ತವೆ.
ಆಜ್ಞೆ | ವಿವರಣೆ |
---|---|
pd.DataFrame(data) | ಡೇಟಾದ ನಿಘಂಟಿನಿಂದ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸುತ್ತದೆ. |
df[column_name] | ಹೆಸರಿನ ಮೂಲಕ ಡೇಟಾಫ್ರೇಮ್ನಲ್ಲಿ ಕಾಲಮ್ ಅನ್ನು ಪ್ರವೇಶಿಸುತ್ತದೆ. |
df[condition] | ಕಾಲಮ್ಗೆ ಅನ್ವಯಿಸಲಾದ ಷರತ್ತಿನ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುತ್ತದೆ. |
print(selected_rows) | ಡಾಟಾಫ್ರೇಮ್ ಅಥವಾ ಅದರ ಉಪವಿಭಾಗವನ್ನು ಕನ್ಸೋಲ್ಗೆ ಮುದ್ರಿಸುತ್ತದೆ. |
df[df['Age'] >df[df['Age'] > 25] | 'ವಯಸ್ಸು' ಕಾಲಮ್ ಮೌಲ್ಯಗಳು 25 ಕ್ಕಿಂತ ಹೆಚ್ಚಿರುವ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆಮಾಡಿ. |
df[df['City'] == 'Chicago'] | 'ಸಿಟಿ' ಕಾಲಮ್ ಮೌಲ್ಯಗಳು 'ಚಿಕಾಗೋ' ಗೆ ಸಮಾನವಾಗಿರುವ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡುತ್ತದೆ. |
ಪಾಂಡಾಗಳಲ್ಲಿ ಡೇಟಾಫ್ರೇಮ್ ಸಾಲು ಆಯ್ಕೆಯನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು
ಒದಗಿಸಲಾದ ಸ್ಕ್ರಿಪ್ಟ್ಗಳು ಪೈಥಾನ್ನಲ್ಲಿನ ಪಾಂಡಾಸ್ ಲೈಬ್ರರಿಯನ್ನು ಬಳಸಿಕೊಂಡು ಕಾಲಮ್ ಮೌಲ್ಯಗಳನ್ನು ಆಧರಿಸಿ ಡೇಟಾಫ್ರೇಮ್ನಿಂದ ಸಾಲುಗಳನ್ನು ಹೇಗೆ ಆಯ್ಕೆ ಮಾಡಬೇಕೆಂದು ತೋರಿಸುತ್ತದೆ. ಇದರೊಂದಿಗೆ ಪಾಂಡಾಗಳ ಗ್ರಂಥಾಲಯವನ್ನು ಆಮದು ಮಾಡಿಕೊಳ್ಳುವ ಮೂಲಕ ಮೊದಲ ಸ್ಕ್ರಿಪ್ಟ್ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ ಆಜ್ಞೆ. ಇದು ನಂತರ ಡೇಟಾದ ನಿಘಂಟನ್ನು ಬಳಸಿಕೊಂಡು ಮಾದರಿ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸುತ್ತದೆ, ಅದನ್ನು ಡೇಟಾಫ್ರೇಮ್ಗೆ ಪರಿವರ್ತಿಸಲಾಗುತ್ತದೆ ಆಜ್ಞೆ. ಸ್ಕ್ರಿಪ್ಟ್ ನಂತರ ಸಾಲು ಆಯ್ಕೆಗಾಗಿ ಎರಡು ವಿಧಾನಗಳನ್ನು ವಿವರಿಸುತ್ತದೆ: 'ವಯಸ್ಸು' ಕಾಲಮ್ ಮೌಲ್ಯವು 25 ಕ್ಕಿಂತ ಹೆಚ್ಚಿರುವ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡುವುದು , ಮತ್ತು 'ಸಿಟಿ' ಕಾಲಮ್ ಮೌಲ್ಯವು 'ಚಿಕಾಗೋ' ಅನ್ನು ಬಳಸುವ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆಮಾಡುವುದು df[df['City'] == 'Chicago']. ಈ ಫಿಲ್ಟರ್ ಮಾಡಿದ ಡೇಟಾಫ್ರೇಮ್ಗಳನ್ನು ಬಳಸಿ ಮುದ್ರಿಸಲಾಗುತ್ತದೆ ಆಯ್ಕೆಮಾಡಿದ ಸಾಲುಗಳನ್ನು ಪ್ರದರ್ಶಿಸಲು ಕಾರ್ಯ.
ಎರಡನೇ ಸ್ಕ್ರಿಪ್ಟ್ ಒಂದೇ ರೀತಿಯ ರಚನೆಯನ್ನು ಅನುಸರಿಸುತ್ತದೆ ಆದರೆ ವಿಭಿನ್ನ ಡೇಟಾ ಮತ್ತು ಆಯ್ಕೆ ಮಾನದಂಡಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಇದು 'ಉತ್ಪನ್ನ', 'ಬೆಲೆ' ಮತ್ತು 'ಸ್ಟಾಕ್' ಕಾಲಮ್ಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಉತ್ಪನ್ನ ಮಾಹಿತಿಯೊಂದಿಗೆ ಡೇಟಾಫ್ರೇಮ್ ಅನ್ನು ರಚಿಸುತ್ತದೆ. 'ಬೆಲೆ' 200 ಕ್ಕಿಂತ ಕಡಿಮೆ ಅಥವಾ ಸಮನಾಗಿರುವಲ್ಲಿ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲಾಗುತ್ತದೆ
ಪಾಂಡಾಗಳಲ್ಲಿ ಡೇಟಾಫ್ರೇಮ್ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆಮಾಡಲು ಸುಧಾರಿತ ತಂತ್ರಗಳು
ಬೂಲಿಯನ್ ಇಂಡೆಕ್ಸಿಂಗ್ ಅನ್ನು ಬಳಸಿಕೊಂಡು ಮೂಲಭೂತ ಫಿಲ್ಟರಿಂಗ್ ಜೊತೆಗೆ, ಕಾಲಮ್ ಮೌಲ್ಯಗಳ ಆಧಾರದ ಮೇಲೆ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಪಾಂಡಾಗಳು ಸುಧಾರಿತ ತಂತ್ರಗಳನ್ನು ನೀಡುತ್ತದೆ. ಒಂದು ಶಕ್ತಿಯುತ ವಿಧಾನವು ಬಳಸುತ್ತಿದೆ ಕಾರ್ಯ, ಇದು ಪ್ರಶ್ನೆಯ ಅಭಿವ್ಯಕ್ತಿಯೊಂದಿಗೆ ಸಾಲುಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ, ಸಿಂಟ್ಯಾಕ್ಸ್ ಕ್ಲೀನರ್ ಮತ್ತು ಹೆಚ್ಚಾಗಿ ಹೆಚ್ಚು ಅರ್ಥಗರ್ಭಿತವಾಗಿದೆ. ಉದಾಹರಣೆಗೆ, ಬಳಸುವ ಬದಲು , ನೀವು ಬರೆಯಬಹುದು . ಹೆಚ್ಚು ಸಂಕೀರ್ಣ ಪರಿಸ್ಥಿತಿಗಳೊಂದಿಗೆ ವ್ಯವಹರಿಸುವಾಗ ಅಥವಾ ಕಾಲಮ್ ಹೆಸರುಗಳು ಸ್ಥಳಗಳನ್ನು ಹೊಂದಿರುವಾಗ ಈ ವಿಧಾನವು ವಿಶೇಷವಾಗಿ ಉಪಯುಕ್ತವಾಗಿದೆ. ಹೆಚ್ಚುವರಿಯಾಗಿ, ದಿ isin() ಮೌಲ್ಯಗಳ ಪಟ್ಟಿಯನ್ನು ಆಧರಿಸಿ ನೀವು ಸಾಲುಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು ಬಯಸಿದಾಗ ಕಾರ್ಯವು ಪ್ರಯೋಜನಕಾರಿಯಾಗಿದೆ. ಉದಾಹರಣೆಗೆ, 'ಸಿಟಿ' ಕಾಲಮ್ ಮೌಲ್ಯವು 'ಚಿಕಾಗೊ' ಅಥವಾ 'ನ್ಯೂಯಾರ್ಕ್' ಆಗಿರುವ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು, ನೀವು ಇದನ್ನು ಬಳಸಬಹುದು .
ಮತ್ತೊಂದು ತಂತ್ರವು ಒಳಗೊಂಡಿರುತ್ತದೆ ಮತ್ತು ಸೂಚ್ಯಂಕಗಳು. ದಿ ಸೂಚ್ಯಂಕವು ಲೇಬಲ್ ಆಧಾರಿತವಾಗಿದೆ, ಇದು ಸಾಲು ಲೇಬಲ್ಗಳು ಮತ್ತು ಕಾಲಮ್ ಹೆಸರುಗಳ ಆಧಾರದ ಮೇಲೆ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ iloc ಪೂರ್ಣಾಂಕ-ಸ್ಥಳ-ಆಧಾರಿತ, ಸಾಲು ಮತ್ತು ಕಾಲಮ್ ಸಂಖ್ಯೆಗಳ ಮೂಲಕ ಆಯ್ಕೆಯನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ. ವಿಭಿನ್ನ ಕಾಲಮ್ಗೆ ಅನ್ವಯಿಸಲಾದ ಷರತ್ತಿನ ಆಧಾರದ ಮೇಲೆ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಈ ನಮ್ಯತೆಯು ವಿಶೇಷವಾಗಿ ಉಪಯುಕ್ತವಾಗಿದೆ. ಉದಾಹರಣೆಗೆ, 25 ಕ್ಕಿಂತ ಹಳೆಯ ವ್ಯಕ್ತಿಗಳ ಹೆಸರನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ. ಪಾಂಡಾಸ್ನಲ್ಲಿ ಡೇಟಾವನ್ನು ಸಮರ್ಥವಾಗಿ ನಿರ್ವಹಿಸಲು ಮತ್ತು ವಿಶ್ಲೇಷಿಸಲು ಈ ವಿಧಾನಗಳು ನಿಮ್ಮ ಟೂಲ್ಕಿಟ್ ಅನ್ನು ವಿಸ್ತರಿಸುತ್ತವೆ, ಹೆಚ್ಚು ಓದಬಲ್ಲ ಮತ್ತು ನಿರ್ವಹಿಸಬಹುದಾದ ಕೋಡ್ ಅನ್ನು ನೀಡುತ್ತವೆ.
- ಬಹು ಷರತ್ತುಗಳ ಆಧಾರದ ಮೇಲೆ ನಾನು ಸಾಲುಗಳನ್ನು ಹೇಗೆ ಆಯ್ಕೆ ಮಾಡಬಹುದು?
- ನೀವು ಬಳಸಬಹುದು ಕಾರ್ಯ ಅಥವಾ ತಾರ್ಕಿಕ ಆಪರೇಟರ್ಗಳೊಂದಿಗೆ ಪರಿಸ್ಥಿತಿಗಳನ್ನು ಸಂಯೋಜಿಸಿ ಮತ್ತು . ಉದಾಹರಣೆಗೆ, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
- ಮೌಲ್ಯಗಳ ಪಟ್ಟಿಯನ್ನು ಆಧರಿಸಿ ನಾನು ಸಾಲುಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಬಹುದೇ?
- ಹೌದು, ಬಳಸಿ ಕಾರ್ಯ. ಉದಾಹರಣೆಗೆ, .
- ಎರಡರ ನಡುವಿನ ವ್ಯತ್ಯಾಸವೇನು ಮತ್ತು ?
- ಲೇಬಲ್ ಆಧಾರಿತವಾಗಿದೆ, ಆದರೆ ಪೂರ್ಣಾಂಕ-ಸ್ಥಳ ಆಧಾರಿತವಾಗಿದೆ. ಬಳಸಿ ಸಾಲು/ಕಾಲಮ್ ಲೇಬಲ್ಗಳೊಂದಿಗೆ ಮತ್ತು iloc ಸಾಲು/ಕಾಲಮ್ ಸೂಚ್ಯಂಕಗಳೊಂದಿಗೆ.
- ಸಾಲುಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡುವಾಗ ನಾನು ನಿರ್ದಿಷ್ಟ ಕಾಲಮ್ಗಳನ್ನು ಹೇಗೆ ಆಯ್ಕೆ ಮಾಡಬಹುದು?
- ನೀವು ಬಳಸಬಹುದು . ಉದಾಹರಣೆಗೆ, .
- ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆಮಾಡುವಾಗ ಕಾಣೆಯಾದ ಮೌಲ್ಯಗಳನ್ನು ನಾನು ಹೇಗೆ ನಿರ್ವಹಿಸುವುದು?
- ಬಳಸಿ ಕಾಣೆಯಾದ ಮೌಲ್ಯಗಳೊಂದಿಗೆ ಸಾಲುಗಳನ್ನು ತೆಗೆದುಹಾಕಲು ಕಾರ್ಯ, ಅಥವಾ ಅವುಗಳನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸಿದ ಮೌಲ್ಯದೊಂದಿಗೆ ಬದಲಾಯಿಸಲು.
- ಸಾಲುಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು ನಾನು ನಿಯಮಿತ ಅಭಿವ್ಯಕ್ತಿಗಳನ್ನು ಬಳಸಬಹುದೇ?
- ಹೌದು, ದಿ ಜೊತೆ ಕಾರ್ಯ ಪ್ಯಾರಾಮೀಟರ್ ರೆಜೆಕ್ಸ್ ಮಾದರಿಗಳ ಆಧಾರದ ಮೇಲೆ ಸಾಲುಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, .
- ಸೂಚ್ಯಂಕದ ಆಧಾರದ ಮೇಲೆ ನಾನು ಸಾಲುಗಳನ್ನು ಹೇಗೆ ಫಿಲ್ಟರ್ ಮಾಡುವುದು?
- ನೀವು ಬಳಸಬಹುದು ಸೂಚ್ಯಂಕ ಹೆಸರಿನೊಂದಿಗೆ. ಉದಾಹರಣೆಗೆ, .
- ನನ್ನ ಕಾಲಮ್ ಹೆಸರುಗಳು ಸ್ಪೇಸ್ಗಳು ಅಥವಾ ವಿಶೇಷ ಅಕ್ಷರಗಳನ್ನು ಹೊಂದಿದ್ದರೆ ಏನು ಮಾಡಬೇಕು?
- ಬಳಸಿ ಬ್ಯಾಕ್ಟಿಕ್ಗಳೊಂದಿಗೆ ಅಂತಹ ಕಾಲಮ್ ಹೆಸರುಗಳನ್ನು ನಿಭಾಯಿಸಬಲ್ಲ ಕಾರ್ಯ. ಉದಾಹರಣೆಗೆ, .
ಡೇಟಾಫ್ರೇಮ್ ಸಾಲು ಆಯ್ಕೆ ತಂತ್ರಗಳ ಅಂತಿಮ ಆಲೋಚನೆಗಳು
ಪಾಂಡಾಸ್ನಲ್ಲಿನ ಕಾಲಮ್ ಮೌಲ್ಯಗಳ ಆಧಾರದ ಮೇಲೆ ಡೇಟಾ ಫ್ರೇಮ್ನಿಂದ ಸಾಲುಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡುವುದು ಡೇಟಾ ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್ಗೆ ನಿರ್ಣಾಯಕ ಕೌಶಲ್ಯವಾಗಿದೆ. ಬೂಲಿಯನ್ ಇಂಡೆಕ್ಸಿಂಗ್ ಸೇರಿದಂತೆ ವಿವಿಧ ವಿಧಾನಗಳನ್ನು ಚರ್ಚಿಸಲಾಗಿದೆ, , , ಮತ್ತು ಲೇಬಲ್-ಆಧಾರಿತ ಮತ್ತು ಪೂರ್ಣಾಂಕ-ಸ್ಥಳ-ಆಧಾರಿತ ಸೂಚ್ಯಂಕದೊಂದಿಗೆ ಮತ್ತು iloc, ಡೇಟಾವನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಫಿಲ್ಟರ್ ಮಾಡಲು ಪ್ರಬಲ ಸಾಧನಗಳನ್ನು ಒದಗಿಸಿ. ಈ ತಂತ್ರಗಳ ಪಾಂಡಿತ್ಯವು ಉತ್ತಮ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಮತ್ತು ಕ್ಲೀನರ್, ಹೆಚ್ಚು ನಿರ್ವಹಿಸಬಹುದಾದ ಕೋಡ್ ಅನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ.