Sütun Değerlerine Göre Pandas DataFrame'deki Satırları Filtreleme

Python

Pandas DataFrame'lerdeki Satırları Filtreleme

Pandas, Python'da veri işleme ve analiz için güçlü bir kütüphanedir. Yaygın bir görev, SQL'in SELECT * FROM tablosu WHERE sütun_adı = bazı_değerlere benzer şekilde sütun değerlerine dayalı olarak bir DataFrame'den satır seçmektir.

Bu kılavuz, Pandas'ta bunu başarmak için çeşitli yöntemler konusunda size yol gösterecek ve verilerinizi verimli bir şekilde filtrelemenizi kolaylaştıracaktır. İster yeni başlayan ister deneyimli bir kullanıcı olun, bu ipuçları veri işleme becerilerinizi geliştirecektir.

Emretmek Tanım
pd.DataFrame(data) Veri sözlüğünden bir DataFrame oluşturur.
df[column_name] DataFrame'deki bir sütuna ada göre erişir.
df[condition] Bir sütuna uygulanan koşula göre DataFrame'i filtreler.
print(selected_rows) DataFrame'i veya onun bir alt kümesini konsola yazdırır.
df[df['Age'] >df[df['Age'] > 25] 'Yaş' sütunu değerlerinin 25'ten büyük olduğu satırları seçer.
df[df['City'] == 'Chicago'] 'Şehir' sütunu değerlerinin 'Chicago'ya eşit olduğu satırları seçer.

Pandalarda DataFrame Satır Seçimini Anlamak

Sağlanan komut dosyaları, Python'daki Pandas kitaplığını kullanarak sütun değerlerine dayalı olarak bir DataFrame'den satırların nasıl seçileceğini gösterir. İlk komut dosyası, Pandas kütüphanesini şu şekilde içe aktararak başlar: emretmek. Daha sonra bir veri sözlüğü kullanarak örnek bir DataFrame oluşturur ve bu, bir DataFrame'e dönüştürülür. emretmek. Komut dosyası daha sonra satır seçimi için iki yöntemi gösterir: 'Yaş' sütun değerinin 25'ten büyük olduğu satırların seçilmesi ve 'Şehir' sütun değerinin 'Chicago' olduğu satırları seçmek için df[df['City'] == 'Chicago']. Bu filtrelenmiş DataFrame'ler kullanılarak yazdırılır. Seçilen satırları görüntüleme işlevi.

İkinci komut dosyası da benzer bir yapı izler ancak farklı veriler ve seçim kriterleri kullanır. 'Ürün', 'Fiyat' ve 'Stok' sütunları dahil olmak üzere ürün bilgilerini içeren bir DataFrame oluşturur. 'Fiyat'ın 200'den küçük veya ona eşit olduğu satırlar seçilir.

Pandalarda DataFrame Satırlarını Seçmek İçin Gelişmiş Teknikler

Boole indekslemeyi kullanan temel filtrelemenin yanı sıra Pandas, sütun değerlerine göre satır seçmek için gelişmiş teknikler sunar. Güçlü bir yöntem, Satırları bir sorgu ifadesiyle filtrelemenize olanak tanıyan, sözdizimini daha temiz ve çoğu zaman daha sezgisel hale getiren işlev. Örneğin, kullanmak yerine , Yazabilirsin . Bu yöntem özellikle daha karmaşık koşullarla uğraşırken veya sütun adları boşluk içerdiğinde kullanışlıdır. Ek olarak, isin() Değerler listesine göre satırları filtrelemek istediğinizde bu işlev faydalıdır. Örneğin, 'Şehir' sütun değerinin 'Chicago' veya 'New York' olduğu satırları seçmek için şunu kullanabilirsiniz: .

Başka bir teknik şunları içerir: Ve indeksleyiciler. Dizin oluşturucu etiket tabanlıdır ve satır etiketlerine ve sütun adlarına göre satır seçmenize olanak tanır. iloc tamsayı konum tabanlıdır ve satır ve sütun numaralarına göre seçim yapılmasına olanak tanır. Bu esneklik, özellikle farklı bir sütuna uygulanan koşula göre satırların seçilmesinde kullanışlıdır. Örneğin, 25 yaşından büyük bireylerin adlarını döndürecektir. Bu yöntemler, Pandas'taki verileri verimli bir şekilde işlemek ve analiz etmek için araç setinizi genişleterek daha okunabilir ve bakımı kolay kodlar sunar.

  1. Birden çok koşula göre satırları nasıl seçebilirim?
  2. Şunu kullanabilirsiniz: gibi mantıksal operatörlerle koşulları işlevlendirin veya birleştirin Ve . Örneğin, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
  3. Değerler listesine göre satırları filtreleyebilir miyim?
  4. Evet, kullan işlev. Örneğin, .
  5. Arasındaki fark nedir Ve ?
  6. etiket tabanlıdır, ancak tamsayı konum tabanlıdır. Kullanmak satır/sütun etiketleriyle ve iloc satır/sütun endeksleri ile.
  7. Satırları filtrelerken belirli sütunları nasıl seçebilirim?
  8. Kullanabilirsiniz . Örneğin, .
  9. Satırları seçerken eksik değerleri nasıl hallederim?
  10. Kullan eksik değerleri olan satırları kaldırma işlevi veya bunları belirli bir değerle değiştirmek için.
  11. Satırları filtrelemek için normal ifadeleri kullanabilir miyim?
  12. Evet ile işlev görür parametresi, normal ifade kalıplarına göre satırları filtrelemenize olanak tanır. Örneğin, .
  13. Dizine göre satırları nasıl filtrelerim?
  14. Kullanabilirsiniz dizin adı ile. Örneğin, .
  15. Sütun adlarımda boşluk veya özel karakterler varsa ne olur?
  16. Kullan Bu tür sütun adlarını geri tıklamalarla işleyebilen işlev. Örneğin, .

DataFrame Satır Seçim Teknikleri Hakkında Son Düşünceler

Pandas'taki sütun değerlerine dayalı olarak bir DataFrame'den satır seçmek, veri işleme için çok önemli bir beceridir. Boolean indeksleme de dahil olmak üzere tartışılan çeşitli yöntemler, , ve etiket tabanlı ve tamsayı konum tabanlı dizin oluşturma Ve iloc, verileri verimli bir şekilde filtrelemek için güçlü araçlar sağlar. Bu tekniklere hakim olmak, daha iyi veri analizine ve daha temiz, daha sürdürülebilir koda olanak tanır.