
ശില്പ - ഇന്ത്യന് ഭാഷാകമ്പ്യൂട്ടിങിലെ സമഗ്രസംരംഭം
************************** *****
ഭാഷാകമ്പ്യൂട്ടിങ് രംഗത്ത് ഇന്ത്യയില് നടക്കുന്ന സ്വതന്ത്ര സോഫ്റ്റ്വേര് സംരംഭങ്ങളെ ഒരു കുടക്കീഴില് കൊണ്ടുവരാന് നടക്കുന്ന ശ്രമം ശ്രദ്ധേയമാകുന്നു. അതിനായി നാലുവര്ഷം മുമ്പാരംഭിച്ച 'ശില്പ സംരംഭ' ( silpa project )ത്തിന് കീഴില് നിലവില് പതിനഞ്ചോളം ഭാഷാകമ്പ്യൂട്ടിങ് സോഫ്റ്റ്വേറുകള് ലഭ്യമാണ്.
ഇപ്പോള് പന്ത്രണ്ടാം വാര്ഷികം ആഘോഷിക്കുന്ന 'സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങി'ലെ സന്നദ്ധപ്രവര്ത്തകരാണ് 'ശില്പ'യ്ക്ക് ചുക്കാന് പിടിക്കുന്നത്. സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങിന്റെ ഒരുവര്ഷം നീളുന്ന വാര്ഷികാഘോഷ പരിപാടികള് ഒക്ടോബര് 14, 15 തീയതികളില് തൃശ്ശൂര് സാഹിത്യ അക്കാദമി ഹാളില് ആരംഭിക്കുകയാണ്.
'രാജ്യത്ത് ഭാഷാകമ്പ്യൂട്ടിങ് രംഗത്ത് സര്ക്കാര്തലത്തില് ഒട്ടേറെ ഗവേഷണങ്ങള് നടക്കുന്നുണ്ട്. പക്ഷേ, അത്തരം ഗവേഷണപദ്ധതികളുടെ ഫണ്ടെത്തുന്നത് പലപ്പോഴും ബഹുരാഷ്ട്ര കുത്തക കമ്പനികളില് നിന്നാകയാല് , അവയൊന്നും രാജ്യത്തെ സാധാരണക്കാര്ക്ക് വേണ്ടി പുറത്തിറക്കാന് കഴിയാറില്ല' -സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ് കൂട്ടായ്മയുടെ സെക്രട്ടറി അനിവര് അരവിന്ദ് അറിയിക്കുന്നു.
ഭാഷാകമ്പ്യൂട്ടിങ് ഗവേഷണം സുതാര്യമായി നടക്കേണ്ട പ്രവര്ത്തനമാണ്. എന്നാല് സര്ക്കാര് തലത്തില് അത്തരം ഗവേഷണങ്ങള്ക്ക് രഹസ്യസ്വഭാവമുള്ളതുകൊണ്ട് അവ പലപ്പോഴും പരാജയപ്പെടുകയാണ് ചെയ്യാറ്. അതില്നിന്ന് ഭിന്നമാണ്, പൊതുജനങ്ങളെ ലക്ഷ്യമാക്കി സ്വതന്ത്ര സോഫ്റ്റ്വേര് പ്രവര്ത്തകര് നടത്തുന്ന ഭാഷാകമ്പ്യൂട്ടിങ് പ്രവര്ത്തനമെന്ന് അനിവര് ചൂണ്ടിക്കാട്ടുന്നു.
സ്വതന്ത്ര സോഫ്റ്റ്വേര് അധിഷ്ഠിതമായ ഭാഷാകമ്പ്യൂട്ടിങ് സാങ്കേതികവിദ്യകള് ഏവര്ക്കും ലഭ്യമാക്കുകയെന്ന ലക്ഷ്യത്തെടെയാണ് 2009 ഏപ്രിലില് 'ശില്പ സംരംഭം' ആരംഭിച്ചത്. http://silpa.org.in/ എന്ന വിലാസത്തില് ലഭ്യമായ 'ശില്പ'യില് പതിനഞ്ചോളം ഇന്ത്യന് ഭാഷാകമ്പ്യൂട്ടിങ് സോഫ്റ്റ്വേറുകള് ലഭ്യമാണ്.
'ഉപയോക്താവ് ഏത് ഭാരതീയഭാഷയിലെഴുതിയാലും, ഭാഷയേതെന്ന് സോഫ്റ്റ്വേര് തന്നെ കണ്ടുപിടിക്കുമെന്നതാണ് ഇവയുടെ പൊതുസവിശേഷത'-അനിവര് അറിയിക്കുന്നു.
ശില്പയില് ലഭ്യമായ സോഫ്റ്റ്വേറുകള് ഏതെന്ന് നോക്കാം -
1. നിഘണ്ടുക്കള് : ഇംഗ്ലീഷ്-മലയാളം, ഇംഗ്ലീഷ്-ഹിന്ദി എന്നിവ.
2. ഏകദേശം എല്ലാ ഭാഷകള്ക്കും വേണ്ടിയുള്ള സ്പെല് ചെക്കര്
3. ഏതൊരു ഭാരതീയ ഭാഷയില് നിന്നും മറ്റൊരു ഭാരതീയ ഭാഷയിലേക്ക് ലിപിമാറ്റം ( Transliteration ) നടത്താനുള്ള സംവിധാനം
4. ഭാഷാ നിയമങ്ങള് അനുസരിച്ചുള്ള വാക്കുകളുടെ അകാരാദിക്രമം ( Sorting ) ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റങ്ങളിലൊക്കെ ഈ ഫീച്ചര് വന്നു കൊണ്ടിരിക്കുന്നതേ ഉള്ളൂ.
5. ഇന്ഡിക് സൗണ്ടെക്സ് സംവിധാനം. അമേരിക്കയിലും മറ്റും സന്സസിന് ഇംഗ്ലീഷ് സൗണ്ടെക്സ് ധാരാളമായി ഉപയോഗിച്ചു വരുന്നുണ്ട്.. ഒരേ പോലെ ഉച്ചരിക്കുന്ന വാക്കുകള്/പേരുകള് ഏതു ഭാരതീയ ഭാഷയിലെഴുതിയാലും ഇതുവെച്ച് ഒരു ഡാറ്റാശേഖരത്തില് നിന്നും കണ്ടെത്തുക അനായാസമാകും.
6. നേരത്തേ പറഞ്ഞ ഉച്ചാരണം കൂടാതെ എഴുത്തിലെ വ്യതിയാനങ്ങളും കണക്കിലെടുത്തുകൊണ്ട് 'ഏകദേശ തെരയല്' ( Inexact search system ). ഇതിലും വേറൊരു ഭാഷയിലെഴുതിയ ഡാറ്റയില് നിന്നും മറ്റൊരു ഭാഷ ഉപയോഗിച്ച് തെരയാം.
7. ഗ്രിഗോറിയന് കലണ്ടറും, ശകവര്ഷവും തമ്മിലുള്ള പരസ്പര തിയ്യതികള് കണ്ടുപിടിക്കല്
8. ആര്യഭടന് പ്രാബല്യത്തില് കൊണ്ടുവന്നു എന്ന് പറയപ്പെടുന്ന പരല്പേര് അല്ലെങ്കില് കടപയാദി എന്ന ഇന്ത്യന് സംഖ്യാസമ്പ്രദായം ഉപയോഗിച്ച് വാക്കുകളില് നിന്നും അവ പ്രതിനിധാനം ചെയ്യുന്ന സംഖ്യ കണ്ടുപിടിക്കല്. ഉദാഹരണത്തിന് ചണ്ഡാംശുചന്ദ്രാധമകുംഭിപാല' എന്ന വാക്കു് 31415926536 എന്ന pi യുടെ മൂല്യത്തെ പ്രതിനിധീകരിക്കുന്നു,
9. മേല്പ്പറഞ്ഞ സംഖ്യാ സമ്പ്രദായമാണ് മേളകര്ത്താ രാഗങ്ങളിലെ 72 രാഗങ്ങളുടെയും പേരിനാധാരം. കൂടാതെ രാഗങ്ങളുടെ പേരുകള് പ്രതിനിധാനം ചെയ്യുന്ന സംഖ്യകളില്നിന്നും ആ രാഗത്തിന്റെ ആരോഹണാവരോഹണങ്ങളിലെ സ്വരസ്ഥാനങ്ങളും ഗണിതശാസ്ത്രപരമായി നിര്ണയിക്കാം. ഇവയ്ക്കുള്ള സംവിധാനം
10. ഭാരതീയ ഭാഷകളെ 'justify aligned' ആയി എഴുതുമ്പോള് ചെയ്യേണ്ട ഹൈഫണേഷന് (വാക്കുകളെ മുറിച്ച് അടുത്ത വരിയിലേക്കാക്കല്)
11. വാക്കുകളെ ഉച്ചാരണഘടകങ്ങളായി ( Syllable ) പിരിക്കല്
13. ആസ്കി എന്കോഡിങ്ങ് മലയാളം ഡാറ്റ യൂണിക്കോഡിലേക്കും തിരിച്ചും മാറ്റാനുള്ള സംവിധാനം
14. ഡെവലപ്പര്മാര്ക്കാവശ്യമായ ചില സോഫ്റ്റ്വേറുകള്
ഇന്ത്യയിലെ ഏറ്റവും വലിയ ഭാഷാകമ്പ്യൂട്ടിങ്ങ് സംരംഭമാണ് ശില്പ. സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിലെ സന്തോഷ് തോട്ടിങ്ങല് ആരംഭമിച്ച ഈ പദ്ധതിയില് വസുദേവ് കമ്മത്ത് , ജിഷ്ണു, ഋഷികേശ് തുടങ്ങി നിരവധി ഡെവലപ്പര്മാര് ഇപ്പോള് പ്രവര്ത്തിക്കുന്നു. കഴിഞ്ഞ 'ഗൂഗിള് സമ്മര് ഓഫ് കോഡി'ന്റെ ഭാഗമായി BITS പിലാനിയില് പഠിക്കുന്ന നിതിന് ഷാജി ഈ സംരംഭത്തിന്റെ വെബ് പുനക്രമീകരണം നടത്തുകയുണ്ടായി
**************************
ഭാഷാകമ്പ്യൂട്ടിങ് രംഗത്ത് ഇന്ത്യയില് നടക്കുന്ന സ്വതന്ത്ര സോഫ്റ്റ്വേര് സംരംഭങ്ങളെ ഒരു കുടക്കീഴില് കൊണ്ടുവരാന് നടക്കുന്ന ശ്രമം ശ്രദ്ധേയമാകുന്നു. അതിനായി നാലുവര്ഷം മുമ്പാരംഭിച്ച 'ശില്പ സംരംഭ' ( silpa project )ത്തിന് കീഴില് നിലവില് പതിനഞ്ചോളം ഭാഷാകമ്പ്യൂട്ടിങ് സോഫ്റ്റ്വേറുകള് ലഭ്യമാണ്.
ഇപ്പോള് പന്ത്രണ്ടാം വാര്ഷികം ആഘോഷിക്കുന്ന 'സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങി'ലെ സന്നദ്ധപ്രവര്ത്തകരാണ് 'ശില്പ'യ്ക്ക് ചുക്കാന് പിടിക്കുന്നത്. സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങിന്റെ ഒരുവര്ഷം നീളുന്ന വാര്ഷികാഘോഷ പരിപാടികള് ഒക്ടോബര് 14, 15 തീയതികളില് തൃശ്ശൂര് സാഹിത്യ അക്കാദമി ഹാളില് ആരംഭിക്കുകയാണ്.
'രാജ്യത്ത് ഭാഷാകമ്പ്യൂട്ടിങ് രംഗത്ത് സര്ക്കാര്തലത്തില് ഒട്ടേറെ ഗവേഷണങ്ങള് നടക്കുന്നുണ്ട്. പക്ഷേ, അത്തരം ഗവേഷണപദ്ധതികളുടെ ഫണ്ടെത്തുന്നത് പലപ്പോഴും ബഹുരാഷ്ട്ര കുത്തക കമ്പനികളില് നിന്നാകയാല് , അവയൊന്നും രാജ്യത്തെ സാധാരണക്കാര്ക്ക് വേണ്ടി പുറത്തിറക്കാന് കഴിയാറില്ല' -സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ് കൂട്ടായ്മയുടെ സെക്രട്ടറി അനിവര് അരവിന്ദ് അറിയിക്കുന്നു.
ഭാഷാകമ്പ്യൂട്ടിങ് ഗവേഷണം സുതാര്യമായി നടക്കേണ്ട പ്രവര്ത്തനമാണ്. എന്നാല് സര്ക്കാര് തലത്തില് അത്തരം ഗവേഷണങ്ങള്ക്ക് രഹസ്യസ്വഭാവമുള്ളതുകൊണ്ട് അവ പലപ്പോഴും പരാജയപ്പെടുകയാണ് ചെയ്യാറ്. അതില്നിന്ന് ഭിന്നമാണ്, പൊതുജനങ്ങളെ ലക്ഷ്യമാക്കി സ്വതന്ത്ര സോഫ്റ്റ്വേര് പ്രവര്ത്തകര് നടത്തുന്ന ഭാഷാകമ്പ്യൂട്ടിങ് പ്രവര്ത്തനമെന്ന് അനിവര് ചൂണ്ടിക്കാട്ടുന്നു.
സ്വതന്ത്ര സോഫ്റ്റ്വേര് അധിഷ്ഠിതമായ ഭാഷാകമ്പ്യൂട്ടിങ് സാങ്കേതികവിദ്യകള് ഏവര്ക്കും ലഭ്യമാക്കുകയെന്ന ലക്ഷ്യത്തെടെയാണ് 2009 ഏപ്രിലില് 'ശില്പ സംരംഭം' ആരംഭിച്ചത്. http://silpa.org.in/ എന്ന വിലാസത്തില് ലഭ്യമായ 'ശില്പ'യില് പതിനഞ്ചോളം ഇന്ത്യന് ഭാഷാകമ്പ്യൂട്ടിങ് സോഫ്റ്റ്വേറുകള് ലഭ്യമാണ്.
'ഉപയോക്താവ് ഏത് ഭാരതീയഭാഷയിലെഴുതിയാലും, ഭാഷയേതെന്ന് സോഫ്റ്റ്വേര് തന്നെ കണ്ടുപിടിക്കുമെന്നതാണ് ഇവയുടെ പൊതുസവിശേഷത'-അനിവര് അറിയിക്കുന്നു.
ശില്പയില് ലഭ്യമായ സോഫ്റ്റ്വേറുകള് ഏതെന്ന് നോക്കാം -
1. നിഘണ്ടുക്കള് : ഇംഗ്ലീഷ്-മലയാളം, ഇംഗ്ലീഷ്-ഹിന്ദി എന്നിവ.
2. ഏകദേശം എല്ലാ ഭാഷകള്ക്കും വേണ്ടിയുള്ള സ്പെല് ചെക്കര്
3. ഏതൊരു ഭാരതീയ ഭാഷയില് നിന്നും മറ്റൊരു ഭാരതീയ ഭാഷയിലേക്ക് ലിപിമാറ്റം ( Transliteration ) നടത്താനുള്ള സംവിധാനം
4. ഭാഷാ നിയമങ്ങള് അനുസരിച്ചുള്ള വാക്കുകളുടെ അകാരാദിക്രമം ( Sorting ) ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റങ്ങളിലൊക്കെ ഈ ഫീച്ചര് വന്നു കൊണ്ടിരിക്കുന്നതേ ഉള്ളൂ.
5. ഇന്ഡിക് സൗണ്ടെക്സ് സംവിധാനം. അമേരിക്കയിലും മറ്റും സന്സസിന് ഇംഗ്ലീഷ് സൗണ്ടെക്സ് ധാരാളമായി ഉപയോഗിച്ചു വരുന്നുണ്ട്.. ഒരേ പോലെ ഉച്ചരിക്കുന്ന വാക്കുകള്/പേരുകള് ഏതു ഭാരതീയ ഭാഷയിലെഴുതിയാലും ഇതുവെച്ച് ഒരു ഡാറ്റാശേഖരത്തില് നിന്നും കണ്ടെത്തുക അനായാസമാകും.
6. നേരത്തേ പറഞ്ഞ ഉച്ചാരണം കൂടാതെ എഴുത്തിലെ വ്യതിയാനങ്ങളും കണക്കിലെടുത്തുകൊണ്ട് 'ഏകദേശ തെരയല്' ( Inexact search system ). ഇതിലും വേറൊരു ഭാഷയിലെഴുതിയ ഡാറ്റയില് നിന്നും മറ്റൊരു ഭാഷ ഉപയോഗിച്ച് തെരയാം.
7. ഗ്രിഗോറിയന് കലണ്ടറും, ശകവര്ഷവും തമ്മിലുള്ള പരസ്പര തിയ്യതികള് കണ്ടുപിടിക്കല്
8. ആര്യഭടന് പ്രാബല്യത്തില് കൊണ്ടുവന്നു എന്ന് പറയപ്പെടുന്ന പരല്പേര് അല്ലെങ്കില് കടപയാദി എന്ന ഇന്ത്യന് സംഖ്യാസമ്പ്രദായം ഉപയോഗിച്ച് വാക്കുകളില് നിന്നും അവ പ്രതിനിധാനം ചെയ്യുന്ന സംഖ്യ കണ്ടുപിടിക്കല്. ഉദാഹരണത്തിന് ചണ്ഡാംശുചന്ദ്രാധമകുംഭിപാല'
9. മേല്പ്പറഞ്ഞ സംഖ്യാ സമ്പ്രദായമാണ് മേളകര്ത്താ രാഗങ്ങളിലെ 72 രാഗങ്ങളുടെയും പേരിനാധാരം. കൂടാതെ രാഗങ്ങളുടെ പേരുകള് പ്രതിനിധാനം ചെയ്യുന്ന സംഖ്യകളില്നിന്നും ആ രാഗത്തിന്റെ ആരോഹണാവരോഹണങ്ങളിലെ സ്വരസ്ഥാനങ്ങളും ഗണിതശാസ്ത്രപരമായി നിര്ണയിക്കാം. ഇവയ്ക്കുള്ള സംവിധാനം
10. ഭാരതീയ ഭാഷകളെ 'justify aligned' ആയി എഴുതുമ്പോള് ചെയ്യേണ്ട ഹൈഫണേഷന് (വാക്കുകളെ മുറിച്ച് അടുത്ത വരിയിലേക്കാക്കല്)
11. വാക്കുകളെ ഉച്ചാരണഘടകങ്ങളായി ( Syllable ) പിരിക്കല്
13. ആസ്കി എന്കോഡിങ്ങ് മലയാളം ഡാറ്റ യൂണിക്കോഡിലേക്കും തിരിച്ചും മാറ്റാനുള്ള സംവിധാനം
14. ഡെവലപ്പര്മാര്ക്കാവശ്യമായ
ഇന്ത്യയിലെ ഏറ്റവും വലിയ ഭാഷാകമ്പ്യൂട്ടിങ്ങ് സംരംഭമാണ് ശില്പ. സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങിലെ സന്തോഷ് തോട്ടിങ്ങല് ആരംഭമിച്ച ഈ പദ്ധതിയില് വസുദേവ് കമ്മത്ത് , ജിഷ്ണു, ഋഷികേശ് തുടങ്ങി നിരവധി ഡെവലപ്പര്മാര് ഇപ്പോള് പ്രവര്ത്തിക്കുന്നു. കഴിഞ്ഞ 'ഗൂഗിള് സമ്മര് ഓഫ് കോഡി'ന്റെ ഭാഗമായി BITS പിലാനിയില് പഠിക്കുന്ന നിതിന് ഷാജി ഈ സംരംഭത്തിന്റെ വെബ് പുനക്രമീകരണം നടത്തുകയുണ്ടായി
അഭിപ്രായങ്ങളൊന്നുമില്ല:
ഒരു അഭിപ്രായം പോസ്റ്റ് ചെയ്യൂ