खात्रीशीर आणि पूर्णपणे ऑफलाइन चालणारी मराठी शब्द विश्लेषण लायब्ररी
marathi-shabda ही मराठी शब्दांचे व्याकरणिक विश्लेषण करण्यासाठी बनवलेली एक प्रोफेशनल Python Library आहे.
हे प्रामुख्याने खालील गोष्टी करते:
- मूळ शब्द शोधणे (Lemma Extraction):
पाण्यावर→पाणी - शब्दकोश (Dictionary Lookup): मराठी शब्दांचे इंग्रजी अर्थ
- रूप परिचय (Morphology): शब्दाची जात (POS), विभक्ती आणि काळ ओळखणे.
हे पूर्णपणे ऑफलाइन चालते. याला इंटरनेटची गरज नाही.
हे प्रोजेक्ट Dual Licensing (दोन परवाने) मॉडेलवर चालते:
-
Source Code (MIT): सॉफ्टवेअरचा कोड MIT License अंतर्गत आहे.
- ✅ तुम्ही कोड वापरू शकता, बदलू शकता (व्यावसायिक वापरासाठी सुद्धा).
-
Data & Dictionary (CC BY-NC-SA 4.0): शब्दकोश आणि डेटा Creative Commons Non-Commercial आहे.
- ❌ डेटाचा वापर पैसे कमावण्यासाठी (Commercial Use) करता येणार नाही.
- ✅ शिक्षण आणि संशोधनासाठी डेटा मोफत आहे.
व्यावसायिक वापरासाठी संपर्क (For Commercial Data Usage):
- Email: [email protected]
- GitHub: @iampratham29
pip install marathi-shabdaआवश्यकता: Python 3.8 किंवा त्यापुढील व्हर्जन.
from marathi_shabda import get_lemma
result = get_lemma("पाण्यावर")
print(result.lemma) # उत्तर: पाणी
print(result.detected_vibhakti) # उत्तर: सप्तमी
print(result.explanation) # उत्तर: "Detected सप्तमी vibhakti"from marathi_shabda import lookup_word
result = lookup_word("पाणी")
print(result.english_meanings) # उत्तर: ['water']आम्ही तुमच्या योगदानाचे स्वागत करतो!
- तुम्हाला काही चुका (Bugs) आढळल्यास GitHub Issues वर कळवा.
- नवीन विभक्ती नियम किंवा सुधारणा सुचवायच्या असतील तर स्वागत आहे.
- टीप: मुख्य कोडची मालकी (Ownership) मूळ लेखकांकडे राखीव आहे.
अधिक माहितीसाठी CONTRIBUTING.md वाचा.
marathi-shabda is a production-quality Python library for analyzing Marathi words. It provides:
- Lemma (stem) extraction from inflected Marathi words
- Dictionary lookup (Marathi ↔ English) with meanings
- Morphological analysis (रूप परिचय) including POS, vibhakti, and kāl detection
It works completely offline with no internet dependency.
This project uses a Split Licensing Model:
The Python code, algorithms, and API structure are licensed under the MIT License.
- ✅ You CAN use the code for commercial software.
- ✅ You CAN modify and distribute the code logic.
The dictionary database (dictionary.db) and linguistic rules are licensed under Creative Commons Non-Commercial.
- ❌ You CANNOT sell the data or use it in commercial products without a license.
- ✅ Free for education, research, and non-profit use.
For commercial data licensing:
- Email: [email protected]
- GitHub: @iampratham29
pip install marathi-shabdaRequirements: Python 3.8+, no external dependencies.
from marathi_shabda import get_lemma
result = get_lemma("पाण्यावर")
print(result.lemma) # पाणी
print(result.confidence) # 0.9
print(result.detected_vibhakti) # VibhaktiType.SAPTAMI (सप्तमी)from marathi_shabda import lookup_word
result = lookup_word("पाणी")
print(result.english_meanings) # ['water']
print(result.found) # True- Dictionary-backed: Uses a built-in SQLite database for authoritative meanings.
- Rule-based: Uses linguistic rules for vibhakti and form handling.
- Explanation: Every result comes with a reason for why it was derived.
- Single words only: Does not parse full sentences.
- Conservative: Prefers to say "Unknown" rather than guessing wrong.
- Transliteration: Roman script support is approximate.
- Prathmesh Santosh Choudhari (@iampratham29)
- Vedangi Deepak Deshpande
- Siddhant Akash Bobde
- @vinodnimbalkar - For valuable open-source contributions to the Marathi language ecosystem.
- Marathi language scholars and grammarians.
- Open-source NLP community.
If you use marathi-shabda in research, please cite:
@software{marathi_shabda,
title = {marathi-shabda: Deterministic Marathi Word Analysis},
author = {Choudhari, Prathmesh Santosh and Deshpande, Vedangi Deepak and Bobde, Siddhant Akash},
year = {2026},
url = {https://github.com/iampratham29/marathi-shabda}
}- Issues: GitHub Issues
- Discussions: GitHub Discussions
Philosophy: When unsure, defer. When confident, explain why.
Built with respect for the Marathi language and its speakers. 🙏