பாண்டாஸில் நெடுவரிசை மறுபெயரிடுதலுக்கான அறிமுகம்
Pandas இல் டேட்டாவுடன் பணிபுரியும் போது, DataFrame இன் நெடுவரிசைகளை மிகவும் அர்த்தமுள்ளதாகவும் எளிதாகவும் வேலை செய்ய மறுபெயரிடுவது அவசியம். தரவு செயலாக்கம் மற்றும் பகுப்பாய்வு பணிகளை மிகவும் உள்ளுணர்வு மற்றும் திறமையானதாக மாற்ற இது உதவும்.
இந்தக் கட்டுரையில், Pandas DataFrame இன் நெடுவரிசை லேபிள்களை ['$a', '$b', '$c', '$d', '$e'] இலிருந்து ['a' ஆக மாற்றுவது எப்படி என்பதை ஆராய்வோம். 'b', 'c', 'd', 'e']. தரவு கையாளுதல் மற்றும் சுத்தப்படுத்தும் பணிப்பாய்வுகளில் இந்த எளிய மற்றும் அத்தியாவசிய பணி ஒரு பொதுவான தேவையாகும்.
| கட்டளை | விளக்கம் |
|---|---|
| pd.DataFrame() | டேட்டாஃப்ரேம் பொருளை உருவாக்குகிறது, இது இரு பரிமாண, அளவு-மாற்றக்கூடிய மற்றும் பெயரிடப்பட்ட அச்சுகளுடன் கூடிய பன்முக அட்டவணை தரவு கட்டமைப்பாகும். |
| df.columns | DataFrame இன் நெடுவரிசை லேபிள்களை அணுகுகிறது. நெடுவரிசைப் பெயர்களைப் பெற அல்லது அமைக்கப் பயன்படுத்தலாம். |
| df.rename() | பழைய பெயர்களின் மேப்பிங்கை புதிய பெயர்களுக்கு வழங்குவதன் மூலம் DataFrame இன் நெடுவரிசைப் பெயர்களை மாற்ற உங்களை அனுமதிக்கிறது. |
| dict(zip()) | இரண்டு பட்டியல்களை ஒன்றாக இணைப்பதன் மூலம் அகராதியை உருவாக்குகிறது, அசல் நெடுவரிசைப் பெயர்களை புதிய நெடுவரிசைப் பெயர்களுக்கு வரைபடமாக்க இங்கே பயன்படுத்தப்படுகிறது. |
| inplace=True | மறுபெயரிடும் முறையில் ஒரு வாதம், புதிய டேட்டாஃப்ரேமைத் தராமல், டேட்டாஃப்ரேமை மாற்றியமைக்கிறது. |
| print(df) | கன்சோலில் டேட்டாஃப்ரேமைக் காண்பிக்கும், புதுப்பிக்கப்பட்ட நெடுவரிசைப் பெயர்களைக் காண உங்களை அனுமதிக்கிறது. |
ஸ்கிரிப்ட்களின் விரிவான விளக்கம்
மேலே கொடுக்கப்பட்டுள்ள ஸ்கிரிப்டுகள், தரவு கையாளுதலில் பொதுவான பணியான Pandas DataFrame இல் நெடுவரிசைகளை எவ்வாறு மறுபெயரிடுவது என்பதை விளக்குகிறது. முதல் ஸ்கிரிப்ட்டில், பாண்டாஸ் நூலகத்தை இறக்குமதி செய்வதன் மூலம் தொடங்குகிறோம் import pandas as pd. அடுத்து, ஒரு DataFrame ஐப் பயன்படுத்தி உருவாக்குகிறோம் pd.DataFrame() என பெயரிடப்பட்ட நெடுவரிசைகளுடன் '$a', '$b', '$c', '$d', மற்றும் '$e'. இந்த நெடுவரிசைகளை மறுபெயரிட, நாங்கள் நேரடியாக டேட்டாஃப்ரேம்களை அமைக்கிறோம் columns புதிய நெடுவரிசைப் பெயர்களுக்கான பண்பு ['a', 'b', 'c', 'd', 'e']. இறுதியாக, புதுப்பிக்கப்பட்ட DataFrame ஐப் பயன்படுத்தி காண்பிக்கிறோம் print(df), இது புதிய நெடுவரிசைப் பெயர்களைக் காட்டுகிறது. பழைய பெயர்களை புதிய பெயர்களுக்கு தெளிவான மற்றும் நேரடி மேப்பிங் செய்யும் போது, நெடுவரிசைகளை மறுபெயரிடுவதற்கு இந்த முறை நேரடியானது மற்றும் திறமையானது.
இரண்டாவது ஸ்கிரிப்ட்டில், நாங்கள் பாண்டாஸ் நூலகத்தையும் இறக்குமதி செய்து இரண்டு பட்டியல்களை வரையறுக்கிறோம்: original_columns மற்றும் new_columns, இது முறையே அசல் மற்றும் புதிய நெடுவரிசைப் பெயர்களைக் கொண்டுள்ளது. நாம் பயன்படுத்தி DataFrame ஐ உருவாக்குகிறோம் pd.DataFrame() தரவு மற்றும் அசல் நெடுவரிசை பெயர்களுடன். நெடுவரிசைகளை மறுபெயரிட, நாங்கள் பயன்படுத்துகிறோம் rename() DataFrame முறை. இந்த முறை பழைய நெடுவரிசைப் பெயர்களை புதிய நெடுவரிசைப் பெயர்களுக்கு வரைபடமாக்கும் அகராதியை எடுக்கிறது dict(zip(original_columns, new_columns)). தி inplace=True ஒரு புதிய DataFrame ஐத் தராமல், DataFrame மாற்றியமைக்கப்படுவதை வாதம் உறுதி செய்கிறது. புதுப்பிக்கப்பட்ட டேட்டாஃப்ரேமைக் காண்பிப்பதே இறுதிப் படியாகும் print(df). நிரல் ரீதியாக நெடுவரிசைகளை மறுபெயரிட வேண்டியிருக்கும் போது அல்லது பெரிய டேட்டாஃப்ரேம்களைக் கையாளும் போது இந்த முறை மிகவும் பயனுள்ளதாக இருக்கும்.
Pandas DataFrame இல் நெடுவரிசைப் பெயர்களை மாற்றுதல்
பாண்டாக்களுடன் பைத்தானைப் பயன்படுத்துதல்
import pandas as pd# Create a DataFramedf = pd.DataFrame({'$a': [1, 2, 3],'$b': [4, 5, 6],'$c': [7, 8, 9],'$d': [10, 11, 12],'$e': [13, 14, 15]})# Rename the columnsdf.columns = ['a', 'b', 'c', 'd', 'e']# Display the DataFrameprint(df)
பாண்டாஸில் டேட்டாஃப்ரேம் நெடுவரிசை லேபிள்களைப் புதுப்பிக்கிறது
பாண்டாஸ் நூலகத்தைப் பயன்படுத்தும் பைதான் ஸ்கிரிப்ட்
import pandas as pd# Define the original column namesoriginal_columns = ['$a', '$b', '$c', '$d', '$e']# Define the new column namesnew_columns = ['a', 'b', 'c', 'd', 'e']# Create a DataFrame with the original columnsdata = [[1, 4, 7, 10, 13],[2, 5, 8, 11, 14],[3, 6, 9, 12, 15]]df = pd.DataFrame(data, columns=original_columns)# Rename the columns using a dictionarydf.rename(columns=dict(zip(original_columns, new_columns)), inplace=True)# Show the updated DataFrameprint(df)
டேட்டாஃப்ரேம் நெடுவரிசைகளை மறுபெயரிடுவதற்கான மேம்பட்ட நுட்பங்கள்
Pandas DataFrame இல் உள்ள நெடுவரிசைகளின் அடிப்படை மறுபெயரிடலுக்கு அப்பால், பல்வேறு சூழ்நிலைகளில் மிகவும் பயனுள்ளதாக இருக்கும் மேம்பட்ட நுட்பங்கள் உள்ளன. உதாரணமாக, சில நேரங்களில் நீங்கள் ஒரு குறிப்பிட்ட முறை அல்லது நிபந்தனையின் அடிப்படையில் நெடுவரிசைகளை மறுபெயரிட வேண்டியிருக்கும். இதுபோன்ற சந்தர்ப்பங்களில், நீங்கள் பட்டியல் புரிதல்கள் அல்லது தி map() விரும்பிய முடிவுகளை அடைய லாம்ப்டா செயல்பாடுகளுடன் இணைந்த செயல்பாடு. இந்த அணுகுமுறை அதிக ஆற்றல்மிக்க மற்றும் நெகிழ்வான நெடுவரிசையை மறுபெயரிட அனுமதிக்கிறது. எடுத்துக்காட்டாக, நெடுவரிசைப் பெயர்களில் இருந்து குறிப்பிட்ட எழுத்துக்களை நீக்கலாம் அல்லது எல்லாப் பெயர்களையும் சிற்றெழுத்துக்கு மாற்றுவது போன்ற மாற்றங்களைப் பயன்படுத்தலாம்.
மற்றொரு மேம்பட்ட நுட்பம் தரவை இறக்குமதி செய்யும் போது நெடுவரிசைகளை மறுபெயரிடுவதை உள்ளடக்கியது. CSV கோப்புகளிலிருந்து தரவை ஏற்றும்போது, நீங்கள் இதைப் பயன்படுத்தலாம் names அளவுரு உள்ள pd.read_csv() புதிய நெடுவரிசைப் பெயர்களைக் குறிப்பிட. சீரற்ற அல்லது விடுபட்ட தலைப்புகளைக் கொண்ட தரவைக் கையாளும் போது இது மிகவும் பயனுள்ளதாக இருக்கும். கூடுதலாக, நீங்கள் பயன்படுத்தலாம் header ஏற்கனவே உள்ள தலைப்புகளைத் தவிர்த்து உங்களுக்கானதை ஒதுக்குவதற்கான அளவுரு. இந்த முறைகள் தரவு ஏற்றுதல் நிலையிலிருந்து நெடுவரிசைப் பெயரிடும் சிக்கல்களைத் தீர்ப்பதன் மூலம் தரவுச் சுத்திகரிப்பு செயல்முறையை நெறிப்படுத்துகின்றன, மேலும் அடுத்தடுத்த தரவு கையாளுதலை மிகவும் திறமையானதாக்குகிறது.
DataFrame நெடுவரிசைகளை மறுபெயரிடுவதற்கான பொதுவான கேள்விகள் மற்றும் பதில்கள்
- டேட்டாஃப்ரேமில் ஒரு நெடுவரிசையை எவ்வாறு மறுபெயரிடுவது?
- பயன்படுத்த rename() பழைய மற்றும் புதிய நெடுவரிசைப் பெயர்களைக் குறிப்பிடும் அகராதியுடன் கூடிய முறை.
- CSV கோப்பைப் படிக்கும்போது நெடுவரிசைகளை மறுபெயரிடலாமா?
- ஆம், பயன்படுத்தவும் names அளவுரு உள்ள pd.read_csv() புதிய நெடுவரிசைப் பெயர்களை அமைக்க.
- அனைத்து நெடுவரிசைப் பெயர்களிலிருந்தும் குறிப்பிட்ட எழுத்துக்களை எவ்வாறு அகற்றுவது?
- ஒரு பட்டியல் புரிதலைப் பயன்படுத்தவும் அல்லது map() நெடுவரிசைப் பெயர்களை மாற்ற லாம்ப்டாவுடன் செயல்படும்.
- நெடுவரிசைகளை அவற்றின் நிலைகளின் அடிப்படையில் மறுபெயரிட முடியுமா?
- ஆம், நீங்கள் DataFrame ஐப் பயன்படுத்தலாம் columns புதிய பெயர்களை அட்டவணைப்படுத்தி ஒதுக்குவதன் மூலம் பண்பு.
- நிபந்தனைகளின் அடிப்படையில் நான் நெடுவரிசைகளை மாறும் வகையில் மறுபெயரிட வேண்டுமானால் என்ன செய்வது?
- நெடுவரிசைப் பெயர்களை அமைக்க பட்டியல் புரிதல் அல்லது லாம்ப்டா செயல்பாட்டிற்குள் நிபந்தனை தர்க்கத்தைப் பயன்படுத்தவும்.
- எனது மாற்றங்கள் அசல் DataFrame இல் பயன்படுத்தப்படுவதை நான் எவ்வாறு உறுதிப்படுத்துவது?
- பயன்படுத்த inplace=True உடன் அளவுரு rename() முறை.
- இடைவெளியை அகற்ற நெடுவரிசைகளின் பெயரை மாற்றலாமா?
- ஆம், நெடுவரிசைப் பெயர்களிலிருந்து இடைவெளியை அகற்ற பட்டியல் புரிதலைப் பயன்படுத்தவும்.
- DataFrame இல் தற்போதைய நெடுவரிசைப் பெயர்களை எவ்வாறு சரிபார்க்கலாம்?
- அணுகவும் columns நெடுவரிசைப் பெயர்களைக் காண DataFrame இன் பண்புக்கூறு.
- DataFrame ஐ வடிகட்டிய பிறகு நான் நெடுவரிசைகளை மறுபெயரிடலாமா?
- ஆம், வடிகட்டுதல் உட்பட எந்த நிலையிலும் நெடுவரிசைகளை மறுபெயரிடலாம்.
- மல்டி-இன்டெக்ஸ் டேட்டாஃப்ரேமில் நெடுவரிசைகளை எவ்வாறு மறுபெயரிடுவது?
- பயன்படுத்த rename() பல குறியீட்டு நெடுவரிசைகளுக்கான நிலை மற்றும் பெயர்களைக் குறிப்பிடும் அகராதியுடன் கூடிய முறை.
நெடுவரிசையின் மறுபெயரிடுதல் பற்றிய இறுதி எண்ணங்கள்
Pandas DataFrame இல் நெடுவரிசைகளை மறுபெயரிடுவது, தரவு முன் செயலாக்கத்தில் ஒரு முக்கியமான படியாகும், இது தரவுத்தொகுப்பின் தெளிவு மற்றும் அணுகலுக்கு உதவுகிறது. நேரடி ஒதுக்கீட்டைப் பயன்படுத்தினாலும் அல்லது மறுபெயரிடுதல்() முறையைப் பயன்படுத்தினாலும், இரண்டு அணுகுமுறைகளும் வெவ்வேறு சூழ்நிலைகளுக்கு ஏற்ப நெகிழ்வான தீர்வுகளை வழங்குகின்றன. இந்த நுட்பங்களை மாஸ்டர் செய்வதன் மூலம், தரவு கையாளுதல் மிகவும் உள்ளுணர்வுடன், சிறந்த தரவு பகுப்பாய்வு மற்றும் தூய்மையான குறியீட்டை எளிதாக்குகிறது. மேம்பட்ட முறைகள் செயல்முறையை மேலும் நெறிப்படுத்துகிறது, இது எந்தவொரு தரவு விஞ்ஞானி அல்லது ஆய்வாளருக்கும் இன்றியமையாத திறமையாக அமைகிறது.