உயிர் பெற்றெழும் மறைந்த மொழிகள்

வண்மை யுடையதொரு சொல்லினால் –
உங்கள் வாழ்வு பெற விரும்பி நிற்கிறோம்
விரியும் அறிவு நிலை காட்டுவீர் – அங்கு
வீழும் சிறுமைகளை ஓட்டுவீர்.

– பாரதி

பழக்கத்திலிருந்த பல மொழிகள் இன்றில்லை என்று ஆய்வுகள் சொல்கின்றன. அவைகளைப் பேசுவாரில்லை. இறந்துவிட்ட இந்த மொழிகளின் இலக்கணம், சொல்லகராதி, தொடரியல் பற்றி நாம் அறியாததால், அவைகள் வழக்கொழிந்து அல்லது குறிப்பிடப்படாமலேயே போய்விட்டன.

வழக்கொழிந்த மொழிகள் வெறும் கல்வித் துறையின் ஆர்வம் மட்டுமல்ல; அதைப் பேசிய மனிதர்கள் பற்றிய சித்திரங்களையும் நாம் இழக்கிறோம். மறைந்துபோன மொழிகளை, இயந்திரக் கற்றல் மூலம் கூகுள் மொழிபெயர்ப்பு போன்ற வழி முறைகளைக்கொண்டு உயிர்ப்பிப்பது என்பது செந்திறனற்றது; ஏனெனில் அந்த மொழிகளைப் பற்றி மிகமிகக் குறைந்த பதிவுகளே உள்ளதால் அறிவியலாளர்களால் இந்த மொழியாக்கத்தைச் சிறப்பாகப் பயன்படுத்த முடியாது. சிலவற்றிற்கு நன்கு ஆராயப்பட்ட ‘ஒப்பு நோக்க உறவு மொழி’ இல்லை; இடைவெளிகளும் நிறுத்தல் குறிகளும் இல்லாமலிருப்பதில் சிக்கல்கள் எழுகின்றன. (வெள்ளைவெளியற்றஇந்தவாக்கியத்தைப்படிப்பதிலுள்ளசிரமங்களைப்பாருங்கள்.)

எம்ஐடியின் கணிணி அறிவியல் மற்றும் செயற்கை நுண்ணறிவு ஆய்வகம் இவ்விஷயத்தில் ஒரு பெரும் காரியத்தைச் செய்திருக்கிறது. மற்ற மொழிகளுடன் இருக்கும் உறவினைப் பற்றிய ஆழமான அறிதல் இல்லாமலேயே, ஒரு புது செயல்முறை அல்லது அமைப்பு, மறைந்த மொழிகளைத் தானாகவே அடையாளப்படுத்தியதுதான் அது. இந்தச் செயல் அமைப்பு, மொழிகளின் இடையே உள்ள உறவை நிர்ணயிக்கும் என்று அவர்கள் காட்டினார்கள்; சமீபத்தில் சொல்லப்பட்ட, அனுமானக் கூற்றான ‘ஐபீரியன்’ (Iberian 1) மொழி, ‘பாஸ்கை’ச் (Basque 2) சேர்ந்ததில்லை என்பதை உறுதிப்படுத்த இதைக் கையாண்டார்கள்.

இந்தக் குழுவின் இறுதி இலக்கு என்பது, பல்லாண்டுகளாக மொழியியலாளர்களுக்கு வசப்படாத தொலைந்த மொழிகளைச் சில ஆயிரம் சொற்களைக்கொண்டு கட்டமைக்க முயல்வதுதான்.

பொதுவாக, சில குறிப்பிட்ட கணிக்கும் வகையில்தான் மொழிகள் உருவாகின்றன என்பது போன்ற வரலாற்று மொழியியலாளர்களின் தீர்க்கமான கருத்துக்களை அடிப்படையெனக்கொண்டு எம்ஐடி பேராசிரியர் ரெஜெனா (தமிழில் ரெஜினா) பார்ஸைலேயின் (Regina Barzilay) தலைமையில் அமைந்த குழு இதை அமைத்துள்ளது. உதாரணமாக, ஒரு குறிப்பிட்ட மொழி, அரிதாகவே, முழு ஒலியையும் இணைத்துக் கொள்கிறது அல்லது தள்ளிவிடுகிறது என்றாலும் சில ஒலி மாற்றங்கள் ஏற்படும் சாத்தியங்களும் உள்ளன – தாய் மொழியில் ‘அ’ என்று இருப்பது, அதன் வம்ச மொழியில் ‘ஆ’ என்று ஆகலாம் – கணிசமான உச்சரிப்பு இடைவெளியினால் அது ‘ஓ’ என ஒலிப்பது குறைந்த சாத்தியங்கள் உள்ள ஒன்று.

இதையும் மற்ற மொழித் தடைகளையும் இணைத்து ரெஜெனாவும் எம்ஐடியில் முனைவர் பட்ட ஆய்வு மாணவருமான ஜியமிங் லோவோவும் (Jiaming Luo) இணைந்து பகுத்துப் பிரித்துப் பொருள் அறியல் ஆற்றல் செயல்முறையை அமைத்தார்கள்; உள்ளீட்டுப் பொருட்களின் குறைவான சமிக்ஞைகளையும், பரந்துபட்ட மாறுபடும் சாத்தியங்களையும் அவர்கள் உணர்ந்தே இந்த இயந்திரக் கற்றல் மொழியினை வடிவமைத்தார்கள். தொடர்புள்ள திசையன்களின் (Vectors) இடைவெளிகளில் பிரதிபலிக்கும் உச்சரிப்புப் பேத ஒலிகளை பல்பரிமாண வெளிகளில் பொருத்தி, இந்த வழிமுறை அம்மொழியின் ஒலிகளைப் பதிக்கக் கற்றுக்கொள்கிறது. இந்த ‘மாதிரி’யானது, மொழி மாறுதல்களில் வரும் தொடர்ந்த முறைகளைக் கையகப்படுத்தி, கணக்கீட்டின் தடைகளாகச் சொல்வதற்கும் உதவுகிறது. இதன் விளைவாக வரும் ‘மாதிரி’ புராதன மொழியைக் கூறிடுவதற்கும் அதையொத்த மொழியில் அதன் சகாக்களை வரைபடமென எழுப்புதலுக்கும் உதவும்.

இறந்த மொழிகளான உகாரிடிக் (Ugaritic) மற்றும், லீனியர் B (Linear B) மொழிகளைப் புரிந்துகொள்ள, சென்ற ஆண்டு ரெஜெனா மற்றும் லோவோ எழுதிய கட்டுரை இம்முயற்சிக்கான உந்துதல் எனலாம்; அதிலும் லீனியர் B-யைப் புரிந்துகொள்ளப் பல்லாண்டுகள் பிடித்தன. முக்கிய வேறுபாடு என்னவென்றால் இவ்விரு மொழிகளும், முறையே ஹீப்ரு மற்றும் கிரேக்கத்தின் தொன்மையான உறவினர்கள் என்று இக்குழுவிற்குத் தெரியும்.

இப்புது அமைப்பில் மொழிகளின் இடையேயான உறவை வழிமுறை தானே பகுத்து அறியும். புரிந்துகொள்வதில், இது மாபெரும் சவால்களுள் ஒன்று. லீனியர் B-யின் அறிந்த வம்சாவளியினரைக் கண்டுபடிப்பதற்குப் பல பத்தாண்டுகள் ஆயின. ஐபீரியனனின் உறவுமொழி பற்றி அறிவாளிகளிடையே பல கருத்து வேறுபாடுகள் உள்ளன. அது பாஸ்க்கைச் சார்ந்தது என்றும், இல்லை என மறுத்தும், ஐபீரியன், அறிந்த எம்மொழியுடனும் தொடர்புறுத்தக் கூடியதன்று என்றும் கருத்துக்கள் நிலவுகின்றன.

இந்த முன்வைக்கப்பட்ட வழிமுறையானது இரு மொழிகளுக்கு இடையே உள்ள நெருக்கத்தைக் காட்டும்; உண்மையில், அறிந்த மொழிகளில் இதைப் பரிசோதித்துப் பார்த்தபோது மிகச் சரியாக மொழிக் குடும்பத்தை இது அடையாளம் காட்டியது. ரோமானிய, ஜெர்மெனிக், துருக்கிய, யூரலிக் போன்ற அதிக வாய்ப்பற்ற மொழிகளையும் கணக்கில் எடுத்துக்கொண்டு, பாஸ்க்கையும் (இதற்கு வாய்ப்பு அதிகம்) சேர்த்துக்கொண்டு, ஐபீரியனை அறியத் தங்களது வழிமுறையை இந்தக் குழுவினர் பயன்படுத்தினர். மற்ற மொழிகளைக் காட்டிலும் லத்தீனும், பாஸ்க்கும் ஐபீரியனுக்கு நெருக்கமாகத் தென்பட்டாலும், உறவுமொழிகள் என்று சொல்ல இயலாதபடி வேறுபாடுகள் உள்ளன.

அறிந்த மொழிகளின் சொல்லோடு உரைகளை இணைப்பதைத் தாண்டி ‘அறிவார்ந்த புரிந்துகொள்ளல்’ என்பதை நோக்கிச் செல்வது இவர்களின் எதிர்காலத் திட்டம். ஐபீரிய அனுபவம் அப்படிச் சொல்லாவிடினும் அறிந்த மொழி ஒன்றிருக்கும் என அனுமானிக்கிறார்கள். எப்படிப் படிப்பது என்பது தெரியாவிடினும் சொற்பொருள் சார்ந்தவற்றை அடையாளப்படுத்துவதன் மூலம் இதைச் செய்யவேண்டி இருக்கலாம்.

“ஆவணங்களில் குறிப்பிடப்பட்டுள்ள மனிதர்கள், இடங்கள் போன்றவற்றை அடையாளப்படுத்திப் பின்னர் அறியப்பெற்ற வரலாற்றுத் சான்றுகளிலிருந்து நுணுக்கமாக இவற்றை ஆராயலாம்,” என்கிறார் இவர். உரைச் செயலாக்கச் செயலிகளில் ‘நிறுவன அடையாளங்கள்’ இன்று பரவலாகப் பயன்படுத்தப்பட்டாலும், அவை மிகச் சரியாக இருக்கிறதென்றாலும் புராதன மொழிகளில் பயிற்சித் தரவுகள் இல்லாத நிலையில் இந்த வகைமை சாத்தியப்படுமா என்பது ஆய்விற்குரிய கேள்வி.


https://news.mit.edu/2020/translating-lost-languages-using-machine-learning-1021 by Adam Conner-Simons/MIT CSAIL Oct-21 by Adam Conner-Simons/MIT CSAIL Oct-21

ஐபீரியன்- புராதன காலத்தில் இருந்த மொழி. பொதுவாக இதை லத்தீனுக்கும் இன்றைய ஸ்பானிஷ் மொழிக்கும் இடையே நிறுத்துகிறார்கள்.

ஸ்பானிஷ்க்கும் இடையே நிறுத்துகிறார்கள்.

Basque- எந்தப் பிரதேசத்தைச் சார்ந்தவர்கள் என்ற தகவல் இல்லை. ஃப்ரான்ஸ் மற்றும் ஸ்பெயின் இடையே வசித்தவர்கள் பேசிய மொழி எனச் சொல்கிறார்கள்.

Uralic-வடக்கு ஸ்காண்டினேவியாவிலிருந்து, மேற்கு சைபீரியா வரை பேசப்பட்ட மொழி இது.

Germanic- ஆங்கிலம், ஜெர்மன் போன்ற மொழிக் குடும்பம்.

Turkic- மத்திய ஆசியாவில் பேசப்பட்டது

தகவலுக்கு:

கடந்த ஆயிரம் ஆண்டுகளில் ஆங்கிலம் எவ்வாறு மாறியிருக்கிறது?

பழைய ஆங்கிலம் (800-1066)

Drihten me raet,ne byth me nanes godes wan.
And he me geseton swythe good feohland.
And fedde me be waetera stathum.

இடை ஆங்கிலம் (1100-1500)

Our Lord gouerneth me, and nothing shal defailen to me.
In the sted of pastur he sett me ther.
He norissed me upon water of fyllyng.

கிங் ஜேம்ஸ் பைபிள் (1611)

The Lord is my shepherd ,I shall not want
He maketh me to lie down in green pastures,
He leadth me beside the still waters.

தற்கால ஆங்கிலம் (1989)

The Lord is my shepherd, I lack nothing.
He lets me lie down in green pastures.
He leads me to still waters.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.