ਪਾਂਡਾਸ ਡੇਟਾਫ੍ਰੇਮ ਵਿੱਚ ਕਤਾਰਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਨਾ
ਪਾਂਡਾਸ ਡੇਟਾ ਹੇਰਾਫੇਰੀ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਪਾਈਥਨ ਵਿੱਚ ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਲਾਇਬ੍ਰੇਰੀ ਹੈ। ਇੱਕ ਆਮ ਕੰਮ ਕਾਲਮ ਮੁੱਲਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਡਾਟਾਫ੍ਰੇਮ ਤੋਂ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਨਾ ਹੈ, SQL ਦੇ SELECT * FROM ਟੇਬਲ WHERE column_name = some_value ਦੇ ਸਮਾਨ।
ਇਹ ਗਾਈਡ ਤੁਹਾਨੂੰ ਪਾਂਡਿਆਂ ਵਿੱਚ ਇਸ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਵੱਖ-ਵੱਖ ਤਰੀਕਿਆਂ ਨਾਲ ਲੈ ਕੇ ਜਾਵੇਗੀ, ਜਿਸ ਨਾਲ ਤੁਹਾਡੇ ਡੇਟਾ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਫਿਲਟਰ ਕਰਨਾ ਆਸਾਨ ਹੋ ਜਾਵੇਗਾ। ਭਾਵੇਂ ਤੁਸੀਂ ਇੱਕ ਸ਼ੁਰੂਆਤੀ ਹੋ ਜਾਂ ਇੱਕ ਅਨੁਭਵੀ ਉਪਭੋਗਤਾ ਹੋ, ਇਹ ਸੁਝਾਅ ਤੁਹਾਡੇ ਡੇਟਾ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਹੁਨਰ ਨੂੰ ਵਧਾਉਣਗੇ।
ਹੁਕਮ | ਵਰਣਨ |
---|---|
pd.DataFrame(data) | ਡੇਟਾ ਦੇ ਡਿਕਸ਼ਨਰੀ ਤੋਂ ਇੱਕ ਡੇਟਾਫ੍ਰੇਮ ਬਣਾਉਂਦਾ ਹੈ। |
df[column_name] | ਨਾਮ ਦੁਆਰਾ ਡੇਟਾਫ੍ਰੇਮ ਵਿੱਚ ਇੱਕ ਕਾਲਮ ਤੱਕ ਪਹੁੰਚ ਕਰਦਾ ਹੈ। |
df[condition] | ਕਾਲਮ 'ਤੇ ਲਾਗੂ ਕੀਤੀ ਸ਼ਰਤ ਦੇ ਆਧਾਰ 'ਤੇ ਡਾਟਾਫ੍ਰੇਮ ਨੂੰ ਫਿਲਟਰ ਕਰਦਾ ਹੈ। |
print(selected_rows) | ਕੰਸੋਲ 'ਤੇ ਡੇਟਾਫ੍ਰੇਮ ਜਾਂ ਇਸਦੇ ਸਬਸੈੱਟ ਨੂੰ ਪ੍ਰਿੰਟ ਕਰਦਾ ਹੈ। |
df[df['Age'] >df[df['Age'] > 25] | ਕਤਾਰਾਂ ਨੂੰ ਚੁਣਦਾ ਹੈ ਜਿੱਥੇ 'ਉਮਰ' ਕਾਲਮ ਦੇ ਮੁੱਲ 25 ਤੋਂ ਵੱਧ ਹਨ। |
df[df['City'] == 'Chicago'] | ਕਤਾਰਾਂ ਨੂੰ ਚੁਣਦਾ ਹੈ ਜਿੱਥੇ 'ਸ਼ਹਿਰ' ਕਾਲਮ ਦੇ ਮੁੱਲ 'ਸ਼ਿਕਾਗੋ' ਦੇ ਬਰਾਬਰ ਹੁੰਦੇ ਹਨ। |
ਪਾਂਡਿਆਂ ਵਿੱਚ ਡੇਟਾਫ੍ਰੇਮ ਕਤਾਰ ਦੀ ਚੋਣ ਨੂੰ ਸਮਝਣਾ
ਪ੍ਰਦਾਨ ਕੀਤੀਆਂ ਸਕ੍ਰਿਪਟਾਂ ਦਿਖਾਉਂਦੀਆਂ ਹਨ ਕਿ ਪਾਈਥਨ ਵਿੱਚ ਪਾਂਡਾਸ ਲਾਇਬ੍ਰੇਰੀ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਕਾਲਮ ਮੁੱਲਾਂ ਦੇ ਅਧਾਰ ਤੇ ਡੇਟਾਫ੍ਰੇਮ ਤੋਂ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਿਵੇਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਪਹਿਲੀ ਸਕ੍ਰਿਪਟ ਪਾਂਡਾਸ ਲਾਇਬ੍ਰੇਰੀ ਨੂੰ ਨਾਲ ਆਯਾਤ ਕਰਕੇ ਸ਼ੁਰੂ ਹੁੰਦੀ ਹੈ ਹੁਕਮ. ਇਹ ਫਿਰ ਡੇਟਾ ਦੇ ਇੱਕ ਡਿਕਸ਼ਨਰੀ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਨਮੂਨਾ ਡੇਟਾਫ੍ਰੇਮ ਬਣਾਉਂਦਾ ਹੈ, ਜਿਸ ਨੂੰ ਡੇਟਾਫ੍ਰੇਮ ਵਿੱਚ ਬਦਲਿਆ ਜਾਂਦਾ ਹੈ ਹੁਕਮ. ਸਕ੍ਰਿਪਟ ਫਿਰ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਲਈ ਦੋ ਤਰੀਕਿਆਂ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ: ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਨਾ ਜਿੱਥੇ 'ਉਮਰ' ਕਾਲਮ ਦਾ ਮੁੱਲ 25 ਤੋਂ ਵੱਧ ਹੈ , ਅਤੇ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਨਾ ਜਿੱਥੇ 'ਸ਼ਹਿਰ' ਕਾਲਮ ਦਾ ਮੁੱਲ 'ਸ਼ਿਕਾਗੋ' ਹੈ df[df['City'] == 'Chicago']. ਇਹ ਫਿਲਟਰ ਕੀਤੇ ਡੇਟਾਫ੍ਰੇਮ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪ੍ਰਿੰਟ ਕੀਤੇ ਜਾਂਦੇ ਹਨ ਚੁਣੀਆਂ ਗਈਆਂ ਕਤਾਰਾਂ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨ ਲਈ ਫੰਕਸ਼ਨ.
ਦੂਜੀ ਸਕ੍ਰਿਪਟ ਇੱਕ ਸਮਾਨ ਢਾਂਚੇ ਦੀ ਪਾਲਣਾ ਕਰਦੀ ਹੈ ਪਰ ਵੱਖ-ਵੱਖ ਡੇਟਾ ਅਤੇ ਚੋਣ ਮਾਪਦੰਡਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ। ਇਹ 'ਉਤਪਾਦ', 'ਕੀਮਤ', ਅਤੇ 'ਸਟਾਕ' ਕਾਲਮਾਂ ਸਮੇਤ ਉਤਪਾਦ ਜਾਣਕਾਰੀ ਦੇ ਨਾਲ ਇੱਕ ਡੇਟਾਫ੍ਰੇਮ ਬਣਾਉਂਦਾ ਹੈ। ਕਤਾਰਾਂ ਚੁਣੀਆਂ ਜਾਂਦੀਆਂ ਹਨ ਜਿੱਥੇ 'ਕੀਮਤ' 200 ਤੋਂ ਘੱਟ ਜਾਂ ਬਰਾਬਰ ਹੋਵੇ
ਪਾਂਡਿਆਂ ਵਿੱਚ ਡੇਟਾਫ੍ਰੇਮ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਨ ਲਈ ਉੱਨਤ ਤਕਨੀਕਾਂ
ਬੂਲੀਅਨ ਇੰਡੈਕਸਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਬੁਨਿਆਦੀ ਫਿਲਟਰਿੰਗ ਤੋਂ ਇਲਾਵਾ, ਪਾਂਡਾਸ ਕਾਲਮ ਮੁੱਲਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਨ ਲਈ ਉੱਨਤ ਤਕਨੀਕਾਂ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ। ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਢੰਗ ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਹੈ ਫੰਕਸ਼ਨ, ਜੋ ਤੁਹਾਨੂੰ ਕਤਾਰਾਂ ਨੂੰ ਇੱਕ ਪੁੱਛਗਿੱਛ ਸਮੀਕਰਨ ਨਾਲ ਫਿਲਟਰ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਸਿੰਟੈਕਸ ਕਲੀਨਰ ਅਤੇ ਅਕਸਰ ਵਧੇਰੇ ਅਨੁਭਵੀ ਹੁੰਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਵਰਤਣ ਦੀ ਬਜਾਏ , ਤੁਸੀਂ ਲਿਖ ਸਕਦੇ ਹੋ . ਇਹ ਵਿਧੀ ਖਾਸ ਤੌਰ 'ਤੇ ਲਾਭਦਾਇਕ ਹੈ ਜਦੋਂ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਸਥਿਤੀਆਂ ਨਾਲ ਨਜਿੱਠਣ ਜਾਂ ਜਦੋਂ ਕਾਲਮ ਦੇ ਨਾਮ ਵਿੱਚ ਖਾਲੀ ਥਾਂਵਾਂ ਹੁੰਦੀਆਂ ਹਨ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਦ isin() ਫੰਕਸ਼ਨ ਉਦੋਂ ਲਾਭਦਾਇਕ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਤੁਸੀਂ ਮੁੱਲਾਂ ਦੀ ਸੂਚੀ ਦੇ ਆਧਾਰ 'ਤੇ ਕਤਾਰਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ। ਉਦਾਹਰਨ ਲਈ, ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਨ ਲਈ ਜਿੱਥੇ 'ਸ਼ਹਿਰ' ਕਾਲਮ ਦਾ ਮੁੱਲ ਜਾਂ ਤਾਂ 'ਸ਼ਿਕਾਗੋ' ਜਾਂ 'ਨਿਊਯਾਰਕ' ਹੈ, ਤੁਸੀਂ ਵਰਤ ਸਕਦੇ ਹੋ .
ਇਕ ਹੋਰ ਤਕਨੀਕ ਸ਼ਾਮਲ ਹੈ ਅਤੇ ਸੂਚਕਾਂਕ ਦ ਇੰਡੈਕਸਰ ਲੇਬਲ-ਅਧਾਰਿਤ ਹੈ, ਜਿਸ ਨਾਲ ਤੁਸੀਂ ਕਤਾਰਾਂ ਲੇਬਲਾਂ ਅਤੇ ਕਾਲਮ ਦੇ ਨਾਮਾਂ ਦੇ ਅਧਾਰ ਤੇ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰ ਸਕਦੇ ਹੋ, ਜਦੋਂ ਕਿ iloc ਪੂਰਨ ਅੰਕ-ਸਥਾਨ-ਆਧਾਰਿਤ ਹੈ, ਕਤਾਰ ਅਤੇ ਕਾਲਮ ਨੰਬਰਾਂ ਦੁਆਰਾ ਚੋਣ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ। ਇਹ ਲਚਕਤਾ ਕਿਸੇ ਵੱਖਰੇ ਕਾਲਮ 'ਤੇ ਲਾਗੂ ਕੀਤੀ ਸ਼ਰਤ ਦੇ ਅਧਾਰ 'ਤੇ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਨ ਲਈ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਲਾਭਦਾਇਕ ਹੈ। ਉਦਾਹਰਣ ਦੇ ਲਈ, 25 ਸਾਲ ਤੋਂ ਵੱਧ ਉਮਰ ਦੇ ਵਿਅਕਤੀਆਂ ਦੇ ਨਾਮ ਵਾਪਸ ਕਰ ਦੇਵੇਗਾ। ਇਹ ਵਿਧੀਆਂ ਪਾਂਡਾ ਵਿੱਚ ਡੇਟਾ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਸੰਭਾਲਣ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ ਤੁਹਾਡੀ ਟੂਲਕਿੱਟ ਦਾ ਵਿਸਤਾਰ ਕਰਦੀਆਂ ਹਨ, ਵਧੇਰੇ ਪੜ੍ਹਨਯੋਗ ਅਤੇ ਸਾਂਭਣਯੋਗ ਕੋਡ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੀਆਂ ਹਨ।
- ਮੈਂ ਕਈ ਸ਼ਰਤਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਿਵੇਂ ਕਰ ਸਕਦਾ ਹਾਂ?
- ਤੁਸੀਂ ਵਰਤ ਸਕਦੇ ਹੋ ਫੰਕਸ਼ਨ ਜਾਂ ਲਾਜ਼ੀਕਲ ਓਪਰੇਟਰਾਂ ਨਾਲ ਸ਼ਰਤਾਂ ਨੂੰ ਜੋੜਦਾ ਹੈ ਅਤੇ . ਉਦਾਹਰਣ ਲਈ, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
- ਕੀ ਮੈਂ ਮੁੱਲਾਂ ਦੀ ਸੂਚੀ ਦੇ ਅਧਾਰ ਤੇ ਕਤਾਰਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰ ਸਕਦਾ ਹਾਂ?
- ਹਾਂ, ਦੀ ਵਰਤੋਂ ਕਰੋ ਫੰਕਸ਼ਨ. ਉਦਾਹਰਣ ਦੇ ਲਈ, .
- ਵਿਚਕਾਰ ਕੀ ਫਰਕ ਹੈ ਅਤੇ ?
- ਲੇਬਲ-ਅਧਾਰਿਤ ਹੈ, ਜਦਕਿ ਪੂਰਨ ਅੰਕ-ਸਥਾਨ-ਆਧਾਰਿਤ ਹੈ। ਵਰਤੋ ਕਤਾਰ/ਕਾਲਮ ਲੇਬਲ ਦੇ ਨਾਲ ਅਤੇ iloc ਕਤਾਰ/ਕਾਲਮ ਸੂਚਕਾਂਕ ਦੇ ਨਾਲ।
- ਕਤਾਰਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਦੇ ਸਮੇਂ ਮੈਂ ਖਾਸ ਕਾਲਮ ਕਿਵੇਂ ਚੁਣ ਸਕਦਾ ਹਾਂ?
- ਤੁਸੀਂ ਵਰਤ ਸਕਦੇ ਹੋ . ਉਦਾਹਰਣ ਲਈ, .
- ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਦੇ ਸਮੇਂ ਮੈਂ ਗੁੰਮ ਹੋਏ ਮੁੱਲਾਂ ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਾਂ?
- ਦੀ ਵਰਤੋਂ ਕਰੋ ਗੁੰਮ ਮੁੱਲ ਵਾਲੀਆਂ ਕਤਾਰਾਂ ਨੂੰ ਹਟਾਉਣ ਲਈ ਫੰਕਸ਼ਨ, ਜਾਂ ਉਹਨਾਂ ਨੂੰ ਇੱਕ ਨਿਰਧਾਰਤ ਮੁੱਲ ਨਾਲ ਬਦਲਣ ਲਈ।
- ਕੀ ਮੈਂ ਕਤਾਰਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਨ ਲਈ ਨਿਯਮਤ ਸਮੀਕਰਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹਾਂ?
- ਹਾਂ, ਦ ਦੇ ਨਾਲ ਫੰਕਸ਼ਨ ਪੈਰਾਮੀਟਰ ਤੁਹਾਨੂੰ ਰੇਜੈਕਸ ਪੈਟਰਨਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਕਤਾਰਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਉਦਾਹਰਣ ਲਈ, .
- ਮੈਂ ਸੂਚਕਾਂਕ ਦੇ ਅਧਾਰ ਤੇ ਕਤਾਰਾਂ ਨੂੰ ਕਿਵੇਂ ਫਿਲਟਰ ਕਰਾਂ?
- ਤੁਸੀਂ ਵਰਤ ਸਕਦੇ ਹੋ ਸੂਚਕਾਂਕ ਨਾਮ ਦੇ ਨਾਲ. ਉਦਾਹਰਣ ਲਈ, .
- ਜੇ ਮੇਰੇ ਕਾਲਮ ਦੇ ਨਾਮ ਵਿੱਚ ਖਾਲੀ ਥਾਂਵਾਂ ਜਾਂ ਵਿਸ਼ੇਸ਼ ਅੱਖਰ ਹਨ ਤਾਂ ਕੀ ਹੋਵੇਗਾ?
- ਦੀ ਵਰਤੋਂ ਕਰੋ ਫੰਕਸ਼ਨ ਜੋ ਅਜਿਹੇ ਕਾਲਮ ਨਾਮਾਂ ਨੂੰ ਬੈਕਟਿਕਸ ਨਾਲ ਹੈਂਡਲ ਕਰ ਸਕਦਾ ਹੈ। ਉਦਾਹਰਣ ਲਈ, .
ਡਾਟਾਫ੍ਰੇਮ ਕਤਾਰ ਚੋਣ ਤਕਨੀਕਾਂ 'ਤੇ ਅੰਤਿਮ ਵਿਚਾਰ
ਪਾਂਡਾਸ ਵਿੱਚ ਕਾਲਮ ਮੁੱਲਾਂ ਦੇ ਅਧਾਰ ਤੇ ਡੇਟਾਫ੍ਰੇਮ ਤੋਂ ਕਤਾਰਾਂ ਦੀ ਚੋਣ ਕਰਨਾ ਡੇਟਾ ਹੇਰਾਫੇਰੀ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹੁਨਰ ਹੈ। ਬੂਲੀਅਨ ਇੰਡੈਕਸਿੰਗ ਸਮੇਤ ਵੱਖ-ਵੱਖ ਤਰੀਕਿਆਂ 'ਤੇ ਚਰਚਾ ਕੀਤੀ ਗਈ, , , ਅਤੇ ਲੇਬਲ-ਅਧਾਰਿਤ ਅਤੇ ਪੂਰਨ ਅੰਕ-ਸਥਾਨ-ਅਧਾਰਿਤ ਇੰਡੈਕਸਿੰਗ ਦੇ ਨਾਲ ਅਤੇ iloc, ਡਾਟਾ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਫਿਲਟਰ ਕਰਨ ਲਈ ਸ਼ਕਤੀਸ਼ਾਲੀ ਟੂਲ ਪ੍ਰਦਾਨ ਕਰੋ। ਇਹਨਾਂ ਤਕਨੀਕਾਂ ਦੀ ਮੁਹਾਰਤ ਬਿਹਤਰ ਡਾਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਕਲੀਨਰ, ਵਧੇਰੇ ਸਾਂਭਣਯੋਗ ਕੋਡ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦੀ ਹੈ।