পান্ডাস ডেটাফ্রেমে ফিল্টারিং সারি
ডাটা ম্যানিপুলেশন এবং বিশ্লেষণের জন্য পান্ডাস পাইথনের একটি শক্তিশালী লাইব্রেরি। একটি সাধারণ কাজ হল কলামের মানের উপর ভিত্তি করে ডেটাফ্রেম থেকে সারি নির্বাচন করা, যা SQL এর SELECT * FROM টেবিল WHERE column_name = some_value-এর মতো।
এই নির্দেশিকা আপনাকে পান্ডাসে এটি অর্জন করার জন্য বিভিন্ন পদ্ধতির মাধ্যমে নিয়ে যাবে, আপনার ডেটা দক্ষতার সাথে ফিল্টার করা সহজ করে। আপনি একজন শিক্ষানবিস বা অভিজ্ঞ ব্যবহারকারী হোন না কেন, এই টিপসগুলি আপনার ডেটা পরিচালনার দক্ষতা বাড়াবে৷
আদেশ | বর্ণনা |
---|---|
pd.DataFrame(data) | ডেটার অভিধান থেকে একটি ডেটাফ্রেম তৈরি করে। |
df[column_name] | নাম অনুসারে ডেটাফ্রেমে একটি কলাম অ্যাক্সেস করে। |
df[condition] | একটি কলামে প্রয়োগ করা শর্তের উপর ভিত্তি করে ডেটাফ্রেম ফিল্টার করে। |
print(selected_rows) | কনসোলে ডেটাফ্রেম বা এর একটি উপসেট প্রিন্ট করে। |
df[df['Age'] >df[df['Age'] > 25] | সারি নির্বাচন করে যেখানে 'বয়স' কলামের মান 25-এর বেশি। |
df[df['City'] == 'Chicago'] | সারি নির্বাচন করে যেখানে 'সিটি' কলামের মান 'শিকাগো'-এর সমান। |
পান্ডাসে ডেটাফ্রেম সারি নির্বাচন বোঝা
প্রদত্ত স্ক্রিপ্টগুলি পাইথনে পান্ডাস লাইব্রেরি ব্যবহার করে কলামের মানের উপর ভিত্তি করে ডেটাফ্রেম থেকে কীভাবে সারি নির্বাচন করতে হয় তা প্রদর্শন করে। প্রথম স্ক্রিপ্টের সাথে পান্ডাস লাইব্রেরি আমদানি করে শুরু হয় আদেশ তারপরে এটি ডেটার একটি অভিধান ব্যবহার করে একটি নমুনা ডেটাফ্রেম তৈরি করে, যা একটি ডেটাফ্রেমে রূপান্তরিত হয় আদেশ তারপর স্ক্রিপ্টটি সারি নির্বাচনের জন্য দুটি পদ্ধতির ব্যাখ্যা করে: সারি নির্বাচন করা যেখানে 'বয়স' কলামের মান 25 এর বেশি , এবং সারি নির্বাচন করা যেখানে 'সিটি' কলামের মান 'শিকাগো' ব্যবহার করে df[df['City'] == 'Chicago']. এই ফিল্টার করা DataFrames ব্যবহার করে মুদ্রিত হয় নির্বাচিত সারি প্রদর্শনের জন্য ফাংশন।
দ্বিতীয় স্ক্রিপ্ট একটি অনুরূপ কাঠামো অনুসরণ করে কিন্তু বিভিন্ন ডেটা এবং নির্বাচনের মানদণ্ড ব্যবহার করে। এটি 'পণ্য', 'মূল্য' এবং 'স্টক' কলাম সহ পণ্যের তথ্য সহ একটি ডেটাফ্রেম তৈরি করে। সারি নির্বাচন করা হয় যেখানে 'মূল্য' 200 এর থেকে কম বা সমান
পান্ডাতে ডেটাফ্রেম সারি নির্বাচনের জন্য উন্নত কৌশল
বুলিয়ান ইনডেক্সিং ব্যবহার করে মৌলিক ফিল্টারিং ছাড়াও, পান্ডাস কলামের মানের উপর ভিত্তি করে সারি নির্বাচন করার জন্য উন্নত কৌশল অফার করে। একটি শক্তিশালী পদ্ধতি ব্যবহার করা হয় ফাংশন, যা আপনাকে একটি ক্যোয়ারী এক্সপ্রেশন সহ সারি ফিল্টার করতে দেয়, সিনট্যাক্সকে ক্লিনার করে এবং প্রায়শই আরও স্বজ্ঞাত করে। উদাহরণস্বরূপ, ব্যবহার করার পরিবর্তে , তুমি লিখতে পারো . এই পদ্ধতিটি বিশেষভাবে উপযোগী যখন আরও জটিল অবস্থার সাথে কাজ করে বা যখন কলামের নামগুলিতে স্পেস থাকে। উপরন্তু, দ isin() আপনি যখন মানগুলির তালিকার উপর ভিত্তি করে সারিগুলি ফিল্টার করতে চান তখন ফাংশনটি উপকারী। উদাহরণস্বরূপ, সারি নির্বাচন করতে যেখানে 'সিটি' কলামের মান হয় 'শিকাগো' বা 'নিউ ইয়র্ক', আপনি ব্যবহার করতে পারেন .
আরেকটি কৌশল জড়িত এবং সূচক দ্য ইনডেক্সারটি লেবেল-ভিত্তিক, আপনাকে সারি লেবেল এবং কলামের নামের উপর ভিত্তি করে সারি নির্বাচন করতে দেয়, যখন iloc পূর্ণসংখ্যা-অবস্থান-ভিত্তিক, সারি এবং কলাম সংখ্যা দ্বারা নির্বাচন সক্ষম করে। এই নমনীয়তা একটি ভিন্ন কলামে প্রয়োগ করা শর্তের উপর ভিত্তি করে সারি নির্বাচন করার জন্য বিশেষভাবে উপযোগী। এই ক্ষেত্রে, 25 বছরের বেশি বয়সী ব্যক্তিদের নাম ফিরিয়ে দেবে। এই পদ্ধতিগুলি পান্ডাসে দক্ষতার সাথে ডেটা পরিচালনা এবং বিশ্লেষণ করার জন্য আপনার টুলকিটকে প্রসারিত করে, আরও পাঠযোগ্য এবং রক্ষণাবেক্ষণযোগ্য কোড অফার করে।
- আমি কিভাবে একাধিক শর্তের উপর ভিত্তি করে সারি নির্বাচন করতে পারি?
- আপনি ব্যবহার করতে পারেন ফাংশন বা লজিক্যাল অপারেটরগুলির সাথে শর্তগুলি একত্রিত করুন এবং . উদাহরণ স্বরূপ, df[(df['Age'] > 25) & (df['City'] == 'Chicago')].
- আমি কি মানের তালিকার উপর ভিত্তি করে সারি ফিল্টার করতে পারি?
- হ্যাঁ, ব্যবহার করুন ফাংশন এই ক্ষেত্রে, .
- পার্থক্য কি এবং ?
- লেবেল ভিত্তিক, যখন পূর্ণসংখ্যা-অবস্থান-ভিত্তিক। ব্যবহার করুন সারি/কলাম লেবেল সহ এবং iloc সারি/কলাম সূচক সহ।
- সারি ফিল্টার করার সময় আমি কীভাবে নির্দিষ্ট কলাম নির্বাচন করতে পারি?
- তুমি ব্যবহার করতে পার . উদাহরণ স্বরূপ, .
- সারি নির্বাচন করার সময় আমি কীভাবে অনুপস্থিত মানগুলি পরিচালনা করব?
- ব্যবহার অনুপস্থিত মান সহ সারি মুছে ফেলার ফাংশন, বা একটি নির্দিষ্ট মান দিয়ে তাদের প্রতিস্থাপন করতে।
- আমি কি সারি ফিল্টার করতে নিয়মিত এক্সপ্রেশন ব্যবহার করতে পারি?
- হ্যাঁ সঙ্গে ফাংশন প্যারামিটার আপনাকে রেজেক্স প্যাটার্নের উপর ভিত্তি করে সারি ফিল্টার করতে দেয়। উদাহরণ স্বরূপ, .
- কিভাবে আমি সূচকের উপর ভিত্তি করে সারি ফিল্টার করব?
- তুমি ব্যবহার করতে পার ইনডেক্স নামের সাথে। উদাহরণ স্বরূপ, .
- যদি আমার কলামের নামগুলিতে স্পেস বা বিশেষ অক্ষর থাকে?
- ব্যবহার ফাংশন যা ব্যাকটিক্সের সাথে এই ধরনের কলামের নামগুলি পরিচালনা করতে পারে। উদাহরণ স্বরূপ, .
ডেটাফ্রেম সারি নির্বাচন কৌশল সম্পর্কে চূড়ান্ত চিন্তা
পান্ডাসে কলাম মানের উপর ভিত্তি করে ডেটাফ্রেম থেকে সারি নির্বাচন করা ডেটা ম্যানিপুলেশনের জন্য একটি গুরুত্বপূর্ণ দক্ষতা। বুলিয়ান ইনডেক্সিং সহ আলোচনা করা বিভিন্ন পদ্ধতি, , , এবং এর সাথে লেবেল-ভিত্তিক এবং পূর্ণসংখ্যা-অবস্থান-ভিত্তিক সূচীকরণ এবং iloc, দক্ষতার সাথে ডেটা ফিল্টার করার জন্য শক্তিশালী সরঞ্জাম সরবরাহ করুন। এই কৌশলগুলির আয়ত্ত আরও ভাল ডেটা বিশ্লেষণ এবং ক্লিনার, আরও রক্ষণাবেক্ষণযোগ্য কোড সক্ষম করে।