$lang['tuto'] = "Туторијали"; ?>$lang['tuto'] = "Туторијали"; ?> Како филтрирати редове у Пандас

Како филтрирати редове у Пандас ДатаФраме-у на основу вредности колоне

Python

Филтрирање редова у Пандас ДатаФрамес

Пандас је моћна библиотека у Питхон-у за манипулацију подацима и анализу. Уобичајени задатак је одабир редова из ДатаФраме-а на основу вредности колоне, слично СКЛ-овој табели СЕЛЕЦТ * ФРОМ ВХЕРЕ име_колоне = нека_вредност.

Овај водич ће вас провести кроз различите методе да то постигнете у Пандас-у, што олакшава ефикасно филтрирање података. Било да сте почетник или искусан корисник, ови савети ће побољшати ваше вештине руковања подацима.

Цомманд Опис
pd.DataFrame(data) Креира ДатаФраме из речника података.
df[column_name] Приступа колони у оквиру ДатаФраме по имену.
df[condition] Филтрира ДатаФраме на основу услова примењеног на колону.
print(selected_rows) Штампа ДатаФраме или његов подскуп на конзолу.
df[df['Age'] >df[df['Age'] > 25] Бира редове у којима су вредности колоне „Старост“ веће од 25.
df[df['City'] == 'Chicago'] Бира редове у којима су вредности колоне „Град“ једнаке „Чикаго“.

Разумевање избора редова ДатаФраме у Пандас

Достављене скрипте показују како да изаберете редове из ДатаФраме-а на основу вредности колона користећи Пандас библиотеку у Питхон-у. Прва скрипта почиње увозом Пандас библиотеке са команда. Затим креира узорак ДатаФраме користећи речник података, који се конвертује у ДатаФраме помоћу команда. Скрипта затим илуструје две методе за избор редова: бирање редова у којима је вредност колоне „Старост“ већа од 25 помоћу , и бирање редова у којима је вредност колоне „Град“ „Чикаго“ користећи df[df['City'] == 'Chicago']. Ови филтрирани оквири података се штампају помоћу функција за приказ изабраних редова.

Друга скрипта има сличну структуру, али користи различите податке и критеријуме одабира. Он креира ДатаФраме са информацијама о производу, укључујући колоне „Производ“, „Цена“ и „Стоцк“. Изабрани су редови где је 'Цена' мања или једнака 200 са

Напредне технике за одабир редова оквира података у Пандас

Поред основног филтрирања помоћу логичког индексирања, Пандас нуди напредне технике за избор редова на основу вредности колона. Једна моћна метода је коришћење функција, која вам омогућава да филтрирате редове са изразом упита, чинећи синтаксу чишћом и често интуитивнијом. На пример, уместо коришћења , можете написати . Овај метод је посебно користан када се ради о сложенијим условима или када називи колона садрже размаке. Поред тога, тхе isin() функција је корисна када желите да филтрирате редове на основу листе вредности. На пример, да бисте изабрали редове у којима је вредност колоне „Град“ или „Чикаго“ или „Њујорк“, можете да користите .

Друга техника укључује и индексери. Тхе Индексер је заснован на ознакама, омогућавајући вам да изаберете редове на основу ознака редова и назива колона, док iloc је базиран на целобројним локацијама, што омогућава избор према бројевима редова и колона. Ова флексибилност је посебно корисна за избор редова на основу услова примењеног на другу колону. На пример, ће вратити имена појединаца старијих од 25 година. Ове методе проширују ваш комплет алата за ефикасно руковање и анализу података у Пандас-у, нудећи читљивији и одрживији код.

  1. Како могу да изаберем редове на основу више услова?
  2. Можете користити функционишу или комбинују услове са логичким операторима попут и . На пример, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
  3. Могу ли да филтрирам редове на основу листе вредности?
  4. Да, користите функција. На пример, .
  5. Која је разлика између и ?
  6. је заснован на етикети, док је заснован на целобројним локацијама. Користите са ознакама редова/колона и iloc са индексима реда/колоне.
  7. Како могу да изаберем одређене колоне док филтрирам редове?
  8. Можете користити . На пример, .
  9. Како да рукујем вредностима које недостају када бирам редове?
  10. Користити функција за уклањање редова са недостајућим вредностима, или да их замени одређеном вредношћу.
  11. Могу ли да користим регуларне изразе за филтрирање редова?
  12. Да, функција са параметар вам омогућава да филтрирате редове на основу образаца регуларних израза. На пример, .
  13. Како да филтрирам редове на основу индекса?
  14. Можете користити са именом индекса. На пример, .
  15. Шта ако називи мојих колона садрже размаке или специјалне знакове?
  16. Користити функција која може да рукује таквим именима колона са позадинским квачицама. На пример, .

Завршна размишљања о техникама одабира редова оквира података

Бирање редова из ДатаФраме-а на основу вредности колона у Пандас-у је кључна вештина за манипулацију подацима. Различите методе о којима се расправља, укључујући логичко индексирање, , , и индексирање засновано на ознакама и целобројним локацијама са и iloc, пружају моћне алате за ефикасно филтрирање података. Овладавање овим техникама омогућава бољу анализу података и чистији код који се може одржавати.