Git LFS रिपोजिटरी आकार को समझना
एक बड़े SVN रिपॉजिटरी को Git में स्थानांतरित करने की प्रक्रिया में, मुझे एक दिलचस्प समस्या का सामना करना पड़ा। बायनेरिज़ को संग्रहीत करने के लिए Git LFS का उपयोग करने के लिए Git रिपॉजिटरी को परिवर्तित करते समय, रिपॉजिटरी का आकार काफी बढ़ गया।
यह लेख इस बात की पड़ताल करता है कि क्यों Git LFS माइग्रेटेड रिपॉजिटरी मूल से बड़ी हो जाती है, और क्या नियमित Git, Git LFS की तुलना में बायनेरिज़ को अधिक कुशलता से पैक करता है। मैं माइग्रेशन प्रक्रिया के दौरान उपयोग किए गए चरणों और आदेशों को भी साझा करूंगा।
| आज्ञा | विवरण |
|---|---|
| git lfs track | Git LFS के साथ निर्दिष्ट फ़ाइल प्रकारों को ट्रैक करता है, बड़ी फ़ाइलों को मुख्य Git रिपॉजिटरी से बाहर ले जाता है। |
| bfg --convert-to-git-lfs | Git इतिहास से बड़ी फ़ाइलों को हटाकर, Git LFS का उपयोग करने के लिए रिपॉजिटरी में निर्दिष्ट फ़ाइल प्रकारों को परिवर्तित करता है। |
| git reflog expire | रीफ्लॉग में सभी प्रविष्टियाँ समाप्त हो जाती हैं, जो LFS माइग्रेशन के बाद रिपॉजिटरी आकार को कम करने में मदद कर सकती हैं। |
| git gc --prune=now --aggressive | अनावश्यक फ़ाइलों को हटाने और रिपॉजिटरी आकार को आक्रामक तरीके से अनुकूलित करने के लिए कचरा संग्रहण चलाता है। |
| subprocess.run | सबप्रोसेस में एक कमांड निष्पादित करता है, जो पायथन स्क्रिप्ट से ऑपरेटिंग सिस्टम के कमांड-लाइन इंटरफ़ेस के साथ इंटरेक्शन की अनुमति देता है। |
| du -sh | किसी निर्दिष्ट निर्देशिका के डिस्क उपयोग को मानव-पठनीय प्रारूप में प्रदर्शित करता है। |
माइग्रेशन स्क्रिप्ट को समझना
बैश स्क्रिप्ट को Git LFS का उपयोग करने के लिए Git रिपॉजिटरी के माइग्रेशन को स्वचालित करने के लिए डिज़ाइन किया गया है। सबसे पहले, यह LFS को आरंभ करता है और बाइनरी फ़ाइलों को ट्रैक करता है आज्ञा। फिर, यह ट्रैकिंग कॉन्फ़िगरेशन को रिपॉजिटरी में जोड़ता है और इसे प्रतिबद्ध करता है। कमांड का उपयोग रिपॉजिटरी में मौजूदा बाइनरी फ़ाइलों को एलएफएस में परिवर्तित करने के लिए किया जाता है, उन्हें प्रभावी रूप से मुख्य गिट इतिहास से हटा दिया जाता है। इस रूपांतरण के बाद, स्क्रिप्ट चलती है और git gc --prune=now पुराने संदर्भों को समाप्त करने और अनावश्यक फ़ाइलों को काटने, रिपॉजिटरी आकार को कम करने के लिए।
पायथन स्क्रिप्ट माइग्रेशन से पहले और बाद में रिपॉजिटरी आकार की तुलना करने का एक तरीका प्रदान करके इसे पूरक करती है। का उपयोग फ़ंक्शन, यह निष्पादित करता है निर्दिष्ट निर्देशिकाओं का डिस्क उपयोग प्राप्त करने के लिए कमांड। यह एलएफएस माइग्रेशन से पहले और बाद के रिपॉजिटरी आकार की स्पष्ट तुलना की अनुमति देता है। आउटपुट माइग्रेशन प्रक्रिया की प्रभावशीलता की पुष्टि करते हुए, रिपॉजिटरी आकार पर माइग्रेशन और क्लीनअप कमांड के प्रभाव को समझने में मदद करता है।
Git LFS माइग्रेशन और क्लीनअप प्रक्रिया को स्वचालित करना
Git LFS माइग्रेशन और क्लीनअप के लिए बैश स्क्रिप्ट
#!/bin/bash# Step 1: Initialize LFS and track file typegit lfs installgit lfs track "*.bin"git add .gitattributesgit commit -m "Track binary files with LFS"# Step 2: Migrate existing files to LFSbfg --convert-to-git-lfs '*.bin' --no-blob-protectiongit reflog expire --expire=now --allgit gc --prune=now --aggressive
प्रवासन के बाद रिपोजिटरी आकार में परिवर्तन का विश्लेषण करना
रिपॉजिटरी आकार तुलना के लिए पायथन स्क्रिप्ट
import subprocessdef get_repo_size(path):result = subprocess.run(['du', '-sh', path], stdout=subprocess.PIPE)size = result.stdout.split()[0].decode('utf-8')return sizebefore_migration = get_repo_size('/path/to/repo_before_lfs')after_migration = get_repo_size('/path/to/repo_after_lfs')print(f"Size before LFS migration: {before_migration}")print(f"Size after LFS migration: {after_migration}")
रिपॉजिटरी आकार पर Git LFS के प्रभाव की खोज
Git LFS में माइग्रेट करने का एक महत्वपूर्ण पहलू Git और Git LFS फ़ाइल भंडारण को संभालने के तरीके में अंतर को समझना है। Git LFS आपके रिपॉजिटरी में बड़ी फ़ाइलों को छोटी पॉइंटर फ़ाइलों से बदल देता है, जबकि वास्तविक फ़ाइल सामग्री अलग से संग्रहीत की जाती है। यह पृथक्करण मूल बड़ी फ़ाइलों और नए एलएफएस पॉइंटर्स दोनों की उपस्थिति के कारण माइग्रेशन के दौरान ऑन-डिस्क आकार को अस्थायी रूप से बढ़ाने का कारण बन सकता है। एक अन्य कारक यह है कि Git LFS विभिन्न संपीड़न और भंडारण तंत्रों का उपयोग करता है, जिसके परिणामस्वरूप हमेशा छोटे रिपॉजिटरी आकार नहीं हो सकते हैं, खासकर माइग्रेशन के तुरंत बाद।
माइग्रेशन के बाद रिपॉजिटरी आकार को अनुकूलित करने के लिए, जैसे कमांड चलाना महत्वपूर्ण है और . ये कमांड अनावश्यक फ़ाइलों और संदर्भों को हटाने में मदद करते हैं, जिससे रिपॉजिटरी का आकार काफी कम हो जाता है। समय के साथ रिपॉजिटरी के आकार की निगरानी करना और इसे अनुकूलित बनाए रखने के लिए नियमित रखरखाव करना भी महत्वपूर्ण है। इन बारीकियों को समझने से अपेक्षाओं को प्रबंधित करने और एक कुशल प्रवासन प्रक्रिया सुनिश्चित करने में मदद मिल सकती है।
- आरंभिक Git LFS माइग्रेशन के बाद रिपॉजिटरी का आकार क्यों बढ़ जाता है?
- यह वृद्धि मूल फ़ाइलों और एलएफएस पॉइंटर्स दोनों की उपस्थिति के कारण है। दौड़ना आदेश इस आकार को कम करने में मदद करते हैं।
- क्या करता है करना?
- यह कमांड पुरानी रीफ्लॉग प्रविष्टियों को हटा देता है, रिपॉजिटरी को साफ करने और स्थान खाली करने में मदद करता है।
- कैसे हुआ काम?
- यह मौजूदा बड़ी फ़ाइलों को Git LFS का उपयोग करने के लिए परिवर्तित करता है, और उन्हें प्रभावी ढंग से मुख्य Git इतिहास से बाहर ले जाता है।
- क्यों इस्तेमाल किया गया?
- यह कमांड आक्रामक रूप से अनावश्यक फ़ाइलों को साफ़ करता है और रिपॉजिटरी स्टोरेज को अनुकूलित करता है।
- Git LFS का उपयोग करने का क्या लाभ है?
- Git LFS बड़ी फ़ाइलों को अलग से संग्रहीत करके रिपॉजिटरी क्लोन के आकार को कम करता है, जिससे प्रदर्शन में सुधार होता है।
- क्या माइग्रेशन के तुरंत बाद रिपॉजिटरी का आकार कम किया जा सकता है?
- हाँ, दौड़कर और अनावश्यक डेटा हटाने का आदेश।
- क्या Git LFS का उपयोग करते समय डेटा हानि का जोखिम है?
- नहीं, जब तक माइग्रेशन और क्लीनअप कमांड सही ढंग से चलाए जाते हैं, डेटा बरकरार रहता है।
- रखरखाव आदेश कितनी बार चलाए जाने चाहिए?
- रखरखाव कमांड को नियमित रूप से चलाने की सलाह दी जाती है, खासकर रिपॉजिटरी में महत्वपूर्ण बदलावों के बाद।
Git LFS माइग्रेशन पर अंतिम विचार
Git LFS में माइग्रेशन के परिणामस्वरूप मूल फ़ाइलों और LFS पॉइंटर्स के सह-अस्तित्व के कारण रिपॉजिटरी आकार में अस्थायी वृद्धि हो सकती है। हालाँकि, रखरखाव आदेश चलाना जैसे कि और आकार को काफी हद तक कम कर सकता है। प्रभावी माइग्रेशन के लिए Git और Git LFS फ़ाइल संग्रहण को कैसे संभालते हैं, इसके अंतर को समझना महत्वपूर्ण है।
हालाँकि प्रारंभिक आकार में वृद्धि चिंताजनक हो सकती है, Git LFS का उपयोग करने के दीर्घकालिक लाभ, विशेष रूप से दूरस्थ भंडारण और क्लोनिंग दक्षता के लिए, अस्थायी नुकसान से अधिक हैं। नियमित रखरखाव और उचित कॉन्फ़िगरेशन एक अनुकूलित और प्रबंधनीय भंडार आकार सुनिश्चित कर सकता है।