$lang['tuto'] = "tutorijali"; ?>$lang['tuto'] = "tutorijali"; ?> Kako filtrirati retke u Pandas DataFrameu na temelju

Kako filtrirati retke u Pandas DataFrameu na temelju vrijednosti stupaca

Python

Filtriranje redaka u Pandas DataFrames

Pandas je moćna biblioteka u Pythonu za manipulaciju i analizu podataka. Uobičajen zadatak je odabir redaka iz DataFramea na temelju vrijednosti stupca, slično SQL-ovoj SELECT * FROM tablici WHERE column_name = some_value.

Ovaj će vas vodič provesti kroz različite metode kako to postići u Pandas, olakšavajući učinkovito filtriranje podataka. Bilo da ste početnik ili iskusan korisnik, ovi savjeti poboljšat će vaše vještine rukovanja podacima.

Naredba Opis
pd.DataFrame(data) Stvara DataFrame iz rječnika podataka.
df[column_name] Pristupa stupcu u DataFrameu po imenu.
df[condition] Filtrira DataFrame na temelju uvjeta primijenjenog na stupac.
print(selected_rows) Ispisuje DataFrame ili njegov podskup na konzolu.
df[df['Age'] >df[df['Age'] > 25] Odabire retke u kojima su vrijednosti stupca "Dob" veće od 25.
df[df['City'] == 'Chicago'] Odaberite retke u kojima su vrijednosti stupca 'Grad' jednake 'Chicago'.

Razumijevanje odabira reda DataFrame u Pandas

Pružene skripte pokazuju kako odabrati retke iz DataFramea na temelju vrijednosti stupaca pomoću biblioteke Pandas u Pythonu. Prva skripta počinje uvozom biblioteke Pandas s naredba. Zatim stvara ogledni DataFrame pomoću rječnika podataka, koji se pretvara u DataFrame s naredba. Skripta zatim ilustrira dvije metode za odabir redaka: odabir redaka gdje je vrijednost stupca 'Dob' veća od 25 pomoću i odabirom redaka u kojima je vrijednost stupca "Grad" "Chicago". df[df['City'] == 'Chicago']. Ovi filtrirani okviri podataka ispisuju se pomoću funkciju za prikaz odabranih redaka.

Druga skripta slijedi sličnu strukturu, ali koristi različite podatke i kriterije odabira. Stvara DataFrame s informacijama o proizvodu, uključujući stupce "Proizvod", "Cijena" i "Zalihe". Odabiru se retci gdje je 'Cijena' manja ili jednaka 200 s

Napredne tehnike za odabir redaka DataFrame u Pandas

Osim osnovnog filtriranja pomoću Booleovog indeksiranja, Pandas nudi napredne tehnike za odabir redaka na temelju vrijednosti stupaca. Jedna moćna metoda je korištenje koja vam omogućuje filtriranje redaka pomoću izraza upita, čineći sintaksu čišćom i često intuitivnijom. Na primjer, umjesto korištenja , možete napisati . Ova je metoda osobito korisna kada se radi o složenijim uvjetima ili kada nazivi stupaca sadrže razmake. Osim toga, isin() funkcija je korisna kada želite filtrirati retke na temelju popisa vrijednosti. Na primjer, za odabir redaka u kojima je vrijednost stupca 'Grad' ili 'Chicago' ili 'New York', možete koristiti .

Druga tehnika uključuje i indekseri. The Indeksator se temelji na oznakama, što vam omogućuje odabir redaka na temelju oznaka redaka i naziva stupaca, dok iloc temelji se na cjelobrojnoj lokaciji, što omogućuje odabir prema brojevima redaka i stupaca. Ova je fleksibilnost posebno korisna za odabir redaka na temelju uvjeta primijenjenog na drugi stupac. Na primjer, vratit će imena osoba starijih od 25 godina. Ove metode proširuju vaš skup alata za učinkovito rukovanje i analizu podataka u Pandas, nudeći čitljiviji kod koji se može održavati.

  1. Kako mogu odabrati retke na temelju više uvjeta?
  2. Možete koristiti funkcioniraju ili kombiniraju uvjete s logičkim operatorima poput i . Na primjer, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
  3. Mogu li filtrirati retke na temelju popisa vrijednosti?
  4. Da, koristite funkcija. Na primjer, .
  5. Koja je razlika između i ?
  6. temelji se na oznakama, dok temelji se na cijelobrojnoj lokaciji. Koristiti s oznakama reda/stupca i iloc s indeksima retka/stupca.
  7. Kako mogu odabrati određene stupce dok filtriram retke?
  8. Možeš koristiti . Na primjer, .
  9. Kako postupati s vrijednostima koje nedostaju pri odabiru redaka?
  10. Koristiti funkciju za uklanjanje redaka s nedostajućim vrijednostima ili zamijeniti ih određenom vrijednošću.
  11. Mogu li koristiti regularne izraze za filtriranje redaka?
  12. Da, funkcija s parametar vam omogućuje filtriranje redaka na temelju uzoraka regularnih izraza. Na primjer, .
  13. Kako mogu filtrirati retke na temelju indeksa?
  14. Možeš koristiti s imenom indeksa. Na primjer, .
  15. Što ako nazivi mojih stupaca sadrže razmake ili posebne znakove?
  16. Koristiti funkcija koja može obraditi takve nazive stupaca s povratnim kvačicama. Na primjer, .

Završne misli o tehnikama odabira reda DataFrame

Odabir redaka iz DataFramea na temelju vrijednosti stupaca u Pandas ključna je vještina za manipulaciju podacima. Različite metode o kojima se govori, uključujući Booleovo indeksiranje, , , te indeksiranje na temelju oznake i lokacije na cijelom broju i iloc, pružaju snažne alate za učinkovito filtriranje podataka. Ovladavanje ovim tehnikama omogućuje bolju analizu podataka i čišći kod koji se lakše održava.