పాండాస్లో కాలమ్ పేరు మార్చడానికి పరిచయం
పాండాస్లో డేటాతో పని చేస్తున్నప్పుడు, డేటాఫ్రేమ్ యొక్క నిలువు వరుసలను మరింత అర్థవంతంగా మరియు సులభంగా పని చేయడానికి వాటి పేరు మార్చడం తరచుగా అవసరం. ఇది డేటా ప్రాసెసింగ్ మరియు విశ్లేషణ పనులను మరింత స్పష్టమైన మరియు సమర్థవంతమైనదిగా చేయడంలో సహాయపడుతుంది.
ఈ కథనంలో, మేము పాండాస్ డేటాఫ్రేమ్ యొక్క కాలమ్ లేబుల్లను ['$a', '$b', '$c', '$d', '$e'] నుండి ['a'కి ఎలా మార్చాలో విశ్లేషిస్తాము, 'b', 'c', 'd', 'e']. డేటా మానిప్యులేషన్ మరియు క్లీనింగ్ వర్క్ఫ్లోలలో ఈ సరళమైన ఇంకా ముఖ్యమైన పని ఒక సాధారణ అవసరం.
| ఆదేశం | వివరణ |
|---|---|
| pd.DataFrame() | డేటాఫ్రేమ్ ఆబ్జెక్ట్ను సృష్టిస్తుంది, ఇది రెండు డైమెన్షనల్, సైజు-మ్యుటబుల్ మరియు లేబుల్ చేయబడిన అక్షాలతో సంభావ్యంగా ఉండే వైవిధ్య పట్టిక డేటా నిర్మాణం. |
| df.columns | డేటాఫ్రేమ్ యొక్క కాలమ్ లేబుల్లను యాక్సెస్ చేస్తుంది. నిలువు వరుస పేర్లను పొందడానికి లేదా సెట్ చేయడానికి ఉపయోగించవచ్చు. |
| df.rename() | పాత పేర్ల మ్యాపింగ్ను కొత్త పేర్లకు అందించడం ద్వారా డేటాఫ్రేమ్ యొక్క నిలువు వరుస పేర్లను మార్చడానికి మిమ్మల్ని అనుమతిస్తుంది. |
| dict(zip()) | రెండు జాబితాలను కలిపి జిప్ చేయడం ద్వారా నిఘంటువును సృష్టిస్తుంది, అసలు నిలువు వరుస పేర్లను కొత్త నిలువు వరుస పేర్లకు మ్యాప్ చేయడానికి ఇక్కడ ఉపయోగించబడుతుంది. |
| inplace=True | కొత్త డేటాఫ్రేమ్ను తిరిగి ఇవ్వకుండానే డేటాఫ్రేమ్ను మార్చే రీనేమ్ పద్ధతిలో వాదన. |
| print(df) | డేటాఫ్రేమ్ను కన్సోల్కు ప్రదర్శిస్తుంది, నవీకరించబడిన నిలువు వరుస పేర్లను చూడటానికి మిమ్మల్ని అనుమతిస్తుంది. |
స్క్రిప్ట్ల వివరణాత్మక వివరణ
పైన అందించిన స్క్రిప్ట్లు డేటా మానిప్యులేషన్లో ఒక సాధారణ పని అయిన పాండాస్ డేటాఫ్రేమ్లో నిలువు వరుసల పేరును ఎలా మార్చాలో ప్రదర్శిస్తాయి. మొదటి స్క్రిప్ట్లో, మేము పాండాస్ లైబ్రరీని దిగుమతి చేయడం ద్వారా ప్రారంభిస్తాము import pandas as pd. తరువాత, మేము ఉపయోగించి DataFrameని సృష్టిస్తాము pd.DataFrame() అని లేబుల్ చేయబడిన నిలువు వరుసలతో '$a', '$b', '$c', '$d', మరియు '$e'. ఈ నిలువు వరుసల పేరు మార్చడానికి, మేము నేరుగా డేటాఫ్రేమ్లను సెట్ చేస్తాము columns కొత్త కాలమ్ పేర్లకు ఆపాదించండి ['a', 'b', 'c', 'd', 'e']. చివరగా, మేము ఉపయోగించి నవీకరించబడిన డేటాఫ్రేమ్ని ప్రదర్శిస్తాము print(df), ఇది కొత్త నిలువు వరుస పేర్లను చూపుతుంది. మీరు పాత పేర్లను కొత్త పేర్లకు స్పష్టమైన మరియు ప్రత్యక్ష మ్యాపింగ్ కలిగి ఉన్నప్పుడు నిలువు వరుసల పేరు మార్చడానికి ఈ పద్ధతి సూటిగా మరియు సమర్థవంతంగా ఉంటుంది.
రెండవ స్క్రిప్ట్లో, మేము పాండాస్ లైబ్రరీని కూడా దిగుమతి చేస్తాము మరియు రెండు జాబితాలను నిర్వచించాము: original_columns మరియు new_columns, ఇది వరుసగా అసలైన మరియు కొత్త నిలువు వరుస పేర్లను కలిగి ఉంటుంది. మేము ఉపయోగించి DataFrameని సృష్టిస్తాము pd.DataFrame() డేటా మరియు అసలు నిలువు వరుస పేర్లతో. నిలువు వరుసల పేరు మార్చడానికి, మేము దీనిని ఉపయోగిస్తాము rename() డేటాఫ్రేమ్ యొక్క పద్ధతి. ఈ పద్ధతి పాత కాలమ్ పేర్లను కొత్త నిలువు వరుస పేర్లకు మ్యాప్ చేసే నిఘంటువుని తీసుకుంటుంది, ఉపయోగించి సృష్టించబడింది dict(zip(original_columns, new_columns)). ది inplace=True ఆర్గ్యుమెంట్ కొత్త డేటాఫ్రేమ్ను తిరిగి ఇవ్వకుండా డేటాఫ్రేమ్ మార్చబడిందని నిర్ధారిస్తుంది. చివరి దశ నవీకరించబడిన డేటాఫ్రేమ్ను ప్రదర్శించడం print(df). మీరు కాలమ్లను ప్రోగ్రామాటిక్గా పేరు మార్చవలసి వచ్చినప్పుడు లేదా ప్రత్యక్ష అసైన్మెంట్ తక్కువ ఆచరణాత్మకంగా ఉండే పెద్ద డేటాఫ్రేమ్లతో వ్యవహరించేటప్పుడు ఈ పద్ధతి ప్రత్యేకంగా ఉపయోగపడుతుంది.
పాండాస్ డేటాఫ్రేమ్లో కాలమ్ పేర్లను మార్చడం
పాండాలతో పైథాన్ని ఉపయోగించడం
import pandas as pd# Create a DataFramedf = pd.DataFrame({'$a': [1, 2, 3],'$b': [4, 5, 6],'$c': [7, 8, 9],'$d': [10, 11, 12],'$e': [13, 14, 15]})# Rename the columnsdf.columns = ['a', 'b', 'c', 'd', 'e']# Display the DataFrameprint(df)
పాండాస్లో డేటాఫ్రేమ్ కాలమ్ లేబుల్లను నవీకరిస్తోంది
పాండాస్ లైబ్రరీని ఉపయోగించి పైథాన్ స్క్రిప్ట్
import pandas as pd# Define the original column namesoriginal_columns = ['$a', '$b', '$c', '$d', '$e']# Define the new column namesnew_columns = ['a', 'b', 'c', 'd', 'e']# Create a DataFrame with the original columnsdata = [[1, 4, 7, 10, 13],[2, 5, 8, 11, 14],[3, 6, 9, 12, 15]]df = pd.DataFrame(data, columns=original_columns)# Rename the columns using a dictionarydf.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)# Show the updated DataFrameprint(df)
డేటాఫ్రేమ్ కాలమ్ల పేరు మార్చడానికి అధునాతన సాంకేతికతలు
పాండాస్ డేటాఫ్రేమ్లోని నిలువు వరుసల ప్రాథమిక పేరు మార్చడం కంటే, విభిన్న దృశ్యాలలో చాలా ఉపయోగకరంగా ఉండే అధునాతన పద్ధతులు ఉన్నాయి. ఉదాహరణకు, కొన్నిసార్లు మీరు నిర్దిష్ట నమూనా లేదా షరతు ఆధారంగా నిలువు వరుసల పేరు మార్చవలసి ఉంటుంది. అటువంటి సందర్భాలలో, మీరు జాబితా గ్రహణాలను ఉపయోగించవచ్చు లేదా map() ఆశించిన ఫలితాలను సాధించడానికి లాంబ్డా ఫంక్షన్లతో కలిపి ఫంక్షన్. ఈ విధానం మరింత డైనమిక్ మరియు సౌకర్యవంతమైన కాలమ్ పేరు మార్చడానికి అనుమతిస్తుంది. ఉదాహరణకు, మీరు నిలువు వరుస పేర్ల నుండి నిర్దిష్ట అక్షరాలను తీసివేయవచ్చు లేదా అన్ని పేర్లను చిన్న అక్షరానికి మార్చడం వంటి పరివర్తనలను వర్తింపజేయవచ్చు.
మరొక అధునాతన సాంకేతికత డేటా దిగుమతి ప్రక్రియలో నిలువు వరుసల పేరు మార్చడం. CSV ఫైల్ల నుండి డేటాను లోడ్ చేస్తున్నప్పుడు, మీరు దీన్ని ఉపయోగించవచ్చు names లో పారామితి pd.read_csv() కొత్త కాలమ్ పేర్లను పేర్కొనడానికి. అస్థిరమైన లేదా తప్పిపోయిన హెడర్లను కలిగి ఉన్న డేటాతో వ్యవహరించేటప్పుడు ఇది ప్రత్యేకంగా ఉపయోగపడుతుంది. అదనంగా, మీరు ఉపయోగించవచ్చు header ఇప్పటికే ఉన్న హెడర్లను దాటవేయడానికి మరియు మీ స్వంతాన్ని కేటాయించడానికి పరామితి. ఈ పద్ధతులు డేటా లోడింగ్ దశ నుండి కాలమ్ నేమింగ్ సమస్యలను పరిష్కరించడం ద్వారా డేటా శుభ్రపరిచే ప్రక్రియను క్రమబద్ధీకరిస్తాయి, తదుపరి డేటా మానిప్యులేషన్ను మరింత సమర్థవంతంగా చేస్తుంది.
డేటాఫ్రేమ్ కాలమ్ల పేరు మార్చడంపై సాధారణ ప్రశ్నలు మరియు సమాధానాలు
- నేను డేటాఫ్రేమ్లో ఒకే నిలువు వరుస పేరును ఎలా మార్చగలను?
- ఉపయోగించడానికి rename() పాత మరియు కొత్త కాలమ్ పేర్లను పేర్కొనే నిఘంటువుతో పద్ధతి.
- CSV ఫైల్ చదువుతున్నప్పుడు నేను నిలువు వరుసల పేరు మార్చవచ్చా?
- అవును, ఉపయోగించండి names లో పారామితి pd.read_csv() కొత్త కాలమ్ పేర్లను సెట్ చేయడానికి.
- నేను అన్ని నిలువు వరుస పేర్ల నుండి నిర్దిష్ట అక్షరాలను ఎలా తీసివేయగలను?
- జాబితా గ్రహణశక్తిని ఉపయోగించండి లేదా map() కాలమ్ పేర్లను సవరించడానికి లాంబ్డాతో ఫంక్షన్.
- నిలువు వరుసలను వాటి స్థానాల ఆధారంగా పేరు మార్చడం సాధ్యమేనా?
- అవును, మీరు డేటాఫ్రేమ్లను ఉపయోగించవచ్చు columns ఇండెక్సింగ్ మరియు కొత్త పేర్లను కేటాయించడం ద్వారా లక్షణం.
- నేను షరతుల ఆధారంగా నిలువు వరుసల పేరును డైనమిక్గా మార్చవలసి వస్తే?
- నిలువు వరుస పేర్లను సెట్ చేయడానికి జాబితా కాంప్రహెన్షన్ లేదా లాంబ్డా ఫంక్షన్లో షరతులతో కూడిన తర్కాన్ని ఉపయోగించండి.
- అసలు డేటాఫ్రేమ్కి నా మార్పులు వర్తింపజేయబడతాయని నేను ఎలా నిర్ధారించగలను?
- ఉపయోగించడానికి inplace=True తో పరామితి rename() పద్ధతి.
- వైట్స్పేస్ని తీసివేయడానికి నేను నిలువు వరుసల పేరు మార్చవచ్చా?
- అవును, నిలువు వరుస పేర్ల నుండి ఖాళీ స్థలాన్ని తీసివేయడానికి జాబితా గ్రహణశక్తిని ఉపయోగించండి.
- డేటాఫ్రేమ్లో ప్రస్తుత నిలువు వరుస పేర్లను నేను ఎలా తనిఖీ చేయాలి?
- యాక్సెస్ చేయండి columns కాలమ్ పేర్లను వీక్షించడానికి డేటాఫ్రేమ్ యొక్క లక్షణం.
- DataFrameని ఫిల్టర్ చేసిన తర్వాత నేను నిలువు వరుసల పేరు మార్చవచ్చా?
- అవును, నిలువు వరుసల పేరు మార్చడం వడపోత తర్వాత సహా ఏ దశలోనైనా చేయవచ్చు.
- మల్టీ-ఇండెక్స్ డేటాఫ్రేమ్లో నేను నిలువు వరుసల పేరును ఎలా మార్చగలను?
- ఉపయోగించడానికి rename() బహుళ-సూచిక నిలువు వరుసల కోసం స్థాయి మరియు పేర్లను పేర్కొనే నిఘంటువుతో కూడిన పద్ధతి.
కాలమ్ పేరు మార్చడంపై తుది ఆలోచనలు
పాండాస్ డేటాఫ్రేమ్లో నిలువు వరుసల పేరు మార్చడం అనేది డేటా ప్రిప్రాసెసింగ్లో కీలకమైన దశ, ఇది డేటాసెట్ యొక్క స్పష్టత మరియు ప్రాప్యతలో సహాయపడుతుంది. డైరెక్ట్ అసైన్మెంట్ లేదా రీనేమ్() పద్ధతిని ఉపయోగించినా, రెండు విధానాలు విభిన్న దృశ్యాలకు అనుగుణంగా అనువైన పరిష్కారాలను అందిస్తాయి. ఈ టెక్నిక్లను మాస్టరింగ్ చేయడం ద్వారా, డేటా మానిప్యులేషన్ మరింత స్పష్టమైనదిగా మారుతుంది, మెరుగైన డేటా విశ్లేషణ మరియు క్లీనర్ కోడ్ను సులభతరం చేస్తుంది. అధునాతన పద్ధతులు ప్రక్రియను మరింత క్రమబద్ధీకరిస్తాయి, ఇది ఏదైనా డేటా శాస్త్రవేత్త లేదా విశ్లేషకుడికి అవసరమైన నైపుణ్యంగా మారుతుంది.