Cara Memfilter Baris di Pandas DataFrame Berdasarkan Nilai Kolom

Python

Memfilter Baris di Pandas DataFrames

Pandas adalah perpustakaan yang kuat di Python untuk manipulasi dan analisis data. Tugas yang umum adalah memilih baris dari DataFrame berdasarkan nilai kolom, mirip dengan tabel SELECT * FROM SQL WHERE Column_name = some_value.

Panduan ini akan memandu Anda melalui berbagai metode untuk mencapai hal ini di Pandas, sehingga memudahkan Anda memfilter data secara efisien. Baik Anda seorang pemula atau pengguna berpengalaman, tips berikut akan meningkatkan keterampilan penanganan data Anda.

Memerintah Keterangan
pd.DataFrame(data) Membuat DataFrame dari kamus data.
df[column_name] Mengakses kolom di DataFrame berdasarkan nama.
df[condition] Memfilter DataFrame berdasarkan kondisi yang diterapkan pada kolom.
print(selected_rows) Mencetak DataFrame atau subsetnya ke konsol.
df[df['Age'] >df[df['Age'] > 25] Memilih baris yang nilai kolom 'Usia' lebih besar dari 25.
df[df['City'] == 'Chicago'] Memilih baris yang nilai kolom 'Kota' sama dengan 'Chicago'.

Memahami Pemilihan Baris DataFrame di Pandas

Skrip yang disediakan menunjukkan cara memilih baris dari DataFrame berdasarkan nilai kolom menggunakan perpustakaan Pandas dengan Python. Skrip pertama dimulai dengan mengimpor perpustakaan Pandas dengan file memerintah. Kemudian membuat sampel DataFrame menggunakan kamus data, yang diubah menjadi DataFrame dengan memerintah. Skrip kemudian mengilustrasikan dua metode untuk pemilihan baris: memilih baris yang nilai kolom 'Usia' lebih besar dari 25 menggunakan , dan memilih baris dengan nilai kolom 'Kota' yang menggunakan 'Chicago' df[df['City'] == 'Chicago']. DataFrame yang difilter ini dicetak menggunakan berfungsi untuk menampilkan baris yang dipilih.

Skrip kedua mengikuti struktur serupa tetapi menggunakan data dan kriteria pemilihan yang berbeda. Ini membuat DataFrame dengan informasi produk, termasuk kolom 'Produk', 'Harga', dan 'Stok'. Baris dipilih dimana 'Harga' kurang dari atau sama dengan 200 dengan

Teknik Tingkat Lanjut untuk Memilih Baris DataFrame di Pandas

Selain pemfilteran dasar menggunakan pengindeksan boolean, Pandas menawarkan teknik lanjutan untuk memilih baris berdasarkan nilai kolom. Salah satu metode ampuh adalah menggunakan fungsi, yang memungkinkan Anda memfilter baris dengan ekspresi kueri, menjadikan sintaksis lebih bersih dan seringkali lebih intuitif. Misalnya, daripada menggunakan , kamu bisa menulis . Metode ini sangat berguna ketika berhadapan dengan kondisi yang lebih kompleks atau ketika nama kolom mengandung spasi. Selain itu, isin() Fungsi ini bermanfaat ketika Anda ingin memfilter baris berdasarkan daftar nilai. Misalnya, untuk memilih baris dengan nilai kolom 'Kota' adalah 'Chicago' atau 'New York', Anda dapat menggunakan .

Teknik lain melibatkan Dan pengindeks. Itu pengindeks berbasis label, memungkinkan Anda memilih baris berdasarkan label baris dan nama kolom, sementara iloc berbasis lokasi bilangan bulat, memungkinkan pemilihan berdasarkan nomor baris dan kolom. Fleksibilitas ini sangat berguna untuk memilih baris berdasarkan kondisi yang diterapkan pada kolom berbeda. Contohnya, akan mengembalikan nama individu yang berusia lebih dari 25 tahun. Metode ini memperluas perangkat Anda untuk menangani dan menganalisis data secara efisien di Pandas, menawarkan kode yang lebih mudah dibaca dan dipelihara.

  1. Bagaimana cara memilih baris berdasarkan beberapa kondisi?
  2. Anda dapat menggunakan berfungsi atau menggabungkan kondisi dengan operator logika seperti Dan . Misalnya, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
  3. Bisakah saya memfilter baris berdasarkan daftar nilai?
  4. Ya, gunakan fungsi. Contohnya, .
  5. Apa perbedaan antara Dan ?
  6. berbasis label, sementara berbasis lokasi bilangan bulat. Menggunakan dengan label baris/kolom dan iloc dengan indeks baris/kolom.
  7. Bagaimana cara memilih kolom tertentu sambil memfilter baris?
  8. Anda dapat gunakan . Misalnya, .
  9. Bagaimana cara menangani nilai yang hilang saat memilih baris?
  10. Menggunakan berfungsi untuk menghapus baris dengan nilai yang hilang, atau untuk menggantinya dengan nilai tertentu.
  11. Bisakah saya menggunakan ekspresi reguler untuk memfilter baris?
  12. Ya, itu berfungsi dengan parameter memungkinkan Anda memfilter baris berdasarkan pola regex. Misalnya, .
  13. Bagaimana cara memfilter baris berdasarkan indeks?
  14. Anda dapat gunakan dengan nama indeks. Misalnya, .
  15. Bagaimana jika nama kolom saya mengandung spasi atau karakter khusus?
  16. Menggunakan fungsi yang dapat menangani nama kolom tersebut dengan backticks. Misalnya, .

Pemikiran Akhir tentang Teknik Pemilihan Baris DataFrame

Memilih baris dari DataFrame berdasarkan nilai kolom di Pandas adalah keterampilan penting untuk manipulasi data. Berbagai metode yang dibahas, termasuk pengindeksan boolean, , , dan pengindeksan berbasis label dan berbasis lokasi bilangan bulat dengan Dan iloc, menyediakan alat canggih untuk memfilter data secara efisien. Penguasaan teknik ini memungkinkan analisis data yang lebih baik dan kode yang lebih bersih dan mudah dipelihara.