உன்னை ஒன்று கேட்பேன்

சொல்வனம் 284-வது இதழில் ‘சொல்லவல்லாயோ, கிளியே?’ என்ற தலைப்பில் சேட்ஜிபிடியைப் பற்றிப் பார்த்தோம். இந்தக் கட்டுரையில் அதன் சில அம்சங்களையும், நேரக்கூடும் என நினைக்கும் பாதகங்களையும் பார்க்கலாம். செயற்கை நுண்ணறிவின் பாதகங்களும் அடங்கிய ஒன்றுதானல்லவா இது?

ஓரு கேள்வி சேட்ஜிபிடியிடம் கேட்கப்பட்டது:

‘புது உணர்விற்கான சொல்லைத் தருவாயா?’

“சொல்ல முடியுமே! மிகத் துல்லிய இசை அமைப்பு கொண்ட அரங்கத்தில் நிகழும் ஒரு இசை நிகழ்ச்சியால் நீங்கள் மகிழ்வீர்கள் என்று நினைத்து அங்கே போவீர்கள்; சிலது மகிழ்வாகவும், சிலது பிடிக்காமலும் ஆகும்; அந்த நிலையை “முழு ஈர்ப்பில்லா நிகழ்ச்சி” என்று சொல்வதற்கு ‘மெ(ஹ்)வெல்ம்ட் (Mehwhelmed) என்ற ஒரு சொல்லைப் பயன்படுத்துவது உங்கள் உணர்வைக் காட்டும்.”

சேட்ஜிபிடியும், கல்வித் துறையும்

சேட்ஜிபிடி ஒரு ‘பெரிய மொழி மாதிரி’ (Large Language Model) என நீங்கள் அறிவீர்கள். நீங்கள் கொடுக்கும் சொற்களைக் கொண்டு, தூண்டும் கேள்விகளைக் கொண்டு, இயற்கை மொழியில் துல்லியமாக உரையாடும் இது, உண்மையில் செயற்கை நுண்ணறிவால் இயங்குகிறது. மனிதர்களைப் போலவே இதன் பதில் இருப்பதில் இதன் வெற்றி அடங்கியுள்ளது. அது மட்டுமல்ல, மிகக் கடுமையான போட்டித் தேர்வுகளில் மனிதனை விட சிறந்த பதிலளித்து வெல்லும் சாதனம் இது. இங்கேதான் எழுகிறது சிக்கல். ஏனெனில், தேர்வெழுதுவோரின் உண்மையான அறிவுத் திறம் வெளிப்படாமல் போகும் அபாயம் உள்ளது. கோவிட்-19 காலத்திலேயே நிகழ்நிலைத் தேர்வுகளில், மாறாட்டம் அதிக அளவில் நடைபெற்றது. இன்று உலகம் இருக்கும் நிலையில், இன்னமும், தொற்றின் பல்வேறு அவதாரங்களில் பல நாடுகள் சிக்கித் தவிக்கையில், நிகழ்நிலைத் தேர்வுகள் தொடரும் கட்டாயத்தில் ‘எழுதியது, கிளியா, மாணவமணியா?’ எனக் கண்டுபிடிப்பது கடினம். கல்வித்துறையில் அறமீறல் நடை பெறலாம்.

சேட்ஜிபிடியால் எந்த அளவிற்குக் கடினமான கேள்விகளை (கல்வி சார்ந்த) உருவாக்கிக் கொள்ள முடியும், பதிலளிக்க முடியும் என்று ஒரு ஆய்வு மேற்கொள்ளப்பட்டது. அது தெளிவான, சரியான, துல்லியமான, பொருத்தமான, ஆழமும், அகலமுமான, தர்க்கத்துடன் பொருந்தக்கூடியதான, உண்மையான (மூலமான) கேள்விகளையும் சிந்தித்து- பதில்களையும் சொல்லியது- மேலும் அதில் கேள்விகள் கேட்க இடமும் அளித்து பதில் சொல்லும் திறனையும் காட்டியது. எனவே, இது தகவலைத் திரும்பத்தரும் சாதனம் மட்டுமல்ல, ஆழமாகச் சிந்திக்கவும் முடியும் இதனால். இந்த நிலைதான் கல்வியாளர்களிடையே கவலையை விதைத்துள்ளது.

மாணவர்கள் சேட்ஜிபிடியைக் கொண்டு தேர்வெழுதி வெற்றி பெறும் சாத்தியங்கள் அதிகமாகும் என்று கல்வியாளர்கள் அஞ்சுகிறார்கள். அப்படி நடக்காமலிருக்க என்ன செய்ய வேண்டும் என்று அதனிடமே கேட்கப்பட்டது.

  • தூண்டுதல் சாதனங்களை/அதைப் போன்ற கருவிகளை மாணவர்கள் பயன்படுத்துவதை தடை செய்ய வேண்டும். (ஆய்வாளர்கள் கருத்து: அனைத்து வியாதிகளுக்குமான ஒரே மருந்து என இதை எடுத்துக் கொள்ள முடியாது.)
  • வேறு வலைத்தளங்களிலிருந்தோ, அவற்றைப் போன்ற மற்றவற்றிலிருந்தோ அவர்கள் பதில்கள் பெறுவதை தடுக்கும் வண்ணம், தேர்வு அமைப்பாளர்கள், பாதுகாப்பான உலாவிகளைப் பயன்படுத்த வேண்டும். (ஆய்வாளர்கள் கருத்து: செலவு மிக்கது)
  • திருட்டைக் கண்டுபிடிக்கும் மென்பொருள் செயலிகளைப் பயன்படுத்தி, சேட்ஜிபிடி அல்லது அதைப் போன்றவைகளைப் பயன்படுத்தும் மாணவர்களைக் கண்காணிக்கலாம். (ஆய்வாளர்கள் கருத்து: சேட்ஜிபிடியே ஒவ்வொரு தூண்டுதலுக்கும் தனிப்பட்ட பதில்களைத் தரும் திறம் கொண்டிருப்பதால், இந்த வழி உதவாது)
  • மொழி இயந்திர செயற்பாடுகளைக் கொண்டு, செயற்கை நுண்ணாறிவினால்தான் மாணவர்கள் தேர்வு எழுதியுள்ளார்களா எனக் கண்டுபிடிக்கலாம். (ஆய்வாளர்கள் கருத்து: இந்த முறையிலும் சில இடர்கள் உண்டு. இவைகள் இன்னமும் வளர வேண்டும். மேலும், செலவு அதிகம் பிடிக்கும். பல பல்கலைகளால் நிறைவேற்ற முடியாது)
  • மாணவர்களுக்கு நல்லறம் போதித்து, குறுக்கு வழியில் நிலைத்த வெற்றியில்லை என்று உணர வைக்கலாம். (ஆய்வாளர்கள் கருத்து: திருடராய் பார்த்து திருந்தாவிட்டால் திருட்டை ஒழிக்க முடியாது)

மேற்சொன்னவைகள் சேட்ஜிபிடி சொன்ன வழிமுறைகள். இந்த ஆய்வினை மேற்கொண்டவர்கள் சில வழிகளைச் சொல்கிறார்கள்:

  • சேட்ஜிபிடி மனித மொழி சார்ந்தது. எனவே, வினாக்களில் உருவங்களையும் இணைத்து கேள்விகளை அமைக்கலாம்.
  • முன்னரே பதிவு செய்த காணொலிகளில், உருவப் படத்துடன், சொற் கேள்வியையும் இணைக்கலாம்.
  • நேரடியாக வினாக்களைத் தொடுக்கலாம்.

ஆனாலும், செயற்கை நுண்ணறிவு சொல், உருவம், மறைக்கப்பட்டுள்ள எழுத்து அனைத்தையும் அறியும் காலம் நெருங்கி வருகிறது.

செயற்கை நுண்ணறிவும், பெண் உடல்களின் கணினித் தோற்றங்களும்

‘லென்சா’ (LENSA) என்றொரு செயற்கை நுண்ணறிவு விண்ணப்பம் இருக்கிறது. அதில் நமது இலக்கத் தோற்றத்தை (Digital Image) நாம் அமைத்துக் கொள்ளலாம். அதாவது நாம் வெவ்வேறு அவதாரங்கள் எடுக்கலாம். இதில் ‘மேஜிக் அவதார்’ வந்திருக்கிறது; இதன் மூலம் நம் இலக்க உருவங்களை கற்பனைக்குத் தோன்றிய வண்ணம் எழுப்பிக் கொள்ளலாம். அதற்கு ஆதாரமாகத் தேவையானது சுயமி.(Selfie)

தனது ‘டெக்னாலஜி ரெவ்யூ கட்டுரையில், (டிச், 12,2022) மெலிசா ஹெய்க்கிலா (Mellisa Heikkila) சொல்கிறார்: இந்த லென்சா விண்ணப்பத்தைக் கொண்டு முயற்சி செய்து பார்க்கையில், அவரது விபரீதமான அவதாரங்கள் வந்துள்ளன. 100-ல், பதினாறு படங்களில் மேலுடம்பு ஆடையற்றும், 14-ல் தோல் வெளியே முழுதும் தெரியமாறு சல்லா போர்வை இட்டும், அழுவது போலும் பல படங்கள். அவருடன் பணி புரியும் ஆண்களின் படங்கள் மேன்மையாளராக, விண்வீர்ராக, சிறந்த விளையாட்டாளராகக் காட்டிய அதுவே, ஆசியப் பெண்களை, சீனப்பெண்களை தரக் குறைவாகக் காட்டியிருக்கிறது. ஆனால், வெள்ளைத் தோலினப் பெண்களை நாகரீகமாகக் காட்டியிருக்கிறது. ஆனாலும், வளைவுகளை விட்டுவிடவில்லை அது.(ஆண்களுக்கான உலகம்!) தன்னை ஒரு ஆணாகக் காட்டுமாறு கேட்ட போதும் அது கவர்ச்சியைக் கை விடவில்லை என்று அவர் எழுதுகிறார்.

லயன் 5 பி (LAION-5B) என்ற, இணையத்திலிருந்து துருவி எடுக்கப்பட்ட அனைவருக்கும் கிடைக்கும் வகைமையில்யுள்ள தகவலை, நிலையான பரவல் (Stable Diffusion) அமைப்பின் மூலம் லென்சா (Lensa) பெறுகிறது. இந்த ‘ஸ்டேபில் டிஃபூஷன்’, (Stable Diffusion) ‘ஸ்டேபில் செயற்கை நுண்ணறிவின்’ (Stable A I) கொடை. Contrastive Language Image Pretraining- CLIP-க்ளிப் என்ற அமைப்பு, நிலையான பரவலுக்கு, உருவப்படங்களை உருவாக்குவதில் உதவுகிறது. உள்ளிடப்பட்ட, விரிவான மொழித் தூண்டுதலால் பெறப்பட்ட, தகவற் களஞ்சியத்திலிருந்து அது உருவப் படங்களை ஒப்பு நோக்கிப் பார்த்து தேர்ந்தெடுக்கிறது. அந்த உள்ளிடப்பட்ட தகவல்கள், இனம் மற்றும் பாலினம் சார்ந்து, நியாயமற்ற சார்பெடுத்து பேதங்களைக் கக்குகிறது. இணையத்திலோ, தரக்குறைவான பல அழகிகளின் படங்கள், அவர்களின் இனம், நிறம், போன்றவை கொட்டிக் கிடக்கின்றன. இனம், மொழி, நாடு என்று வகை வகையாகத் தென்படுகின்றன. இதுதான் நிரந்தரப் பரவல் தன் இடு பொருளைச் சேகரிக்கும் இடம். அது லென்சாவில் இடம் பெறுகிறது. விளைவு, வெள்ளையர் அல்லாத பெண் இனம், அதுவும் யுவதிகள் பாதிக்கப்படுகின்றனர்.

செயற்கை நுண்ணறிவு அமைப்பில் இடம் பெறும் பேதங்களைப் பற்றி வாஷிங்டன் பல்கலையில் பணி புரியும் அயலின் காலிஸ்கென், (Aylin Caliskan) பெண்கள், தாங்கள் அப்படிக் காட்டப்படுவதை விரும்பாத போதிலும், அவர்களை அப்படிக் காட்டும் வண்ணமே உள்ளீடுகள் உள்ளதாகத் தெரிவிக்கிறார். அடிப்படைக் காரணம் லயன் 5 பி ஒரு திறந்த தகவல் திரட்டாக இருப்பதுதான். இதில் ஓபன்-ஏ ஐயின் (Open-AI) டால்-இ, (Dall-E) கூகுளின், ‘இமேஜென்’ (Imagen) ஒன்றும் தரம் கூடியவை அல்ல. அவைகளில் திறந்த மூல இடுகைப் பொருள் கிடையாது என்றாலும், அவைகளும் இந்த லென்சாவைப் போலத்தான்.

மெலிசா சொல்கிறார் அவரது சுயமிகள் ஆண் உள்ளடக்க வடிகட்டியில் அனுப்பப்பட்ட போது, நாகரீகத் தோற்றத்துடன், வெள்ளை கோட்டுடன் உருவமைந்து வந்ததாம்.

கார்னிஜீ பல்கலையின் முனைவர் பட்ட ஆய்வு மாணவரான ரயன் ஸ்டீட் (Ryan Steed) சொல்கிறார்: இயந்திரப் பயிற்சிகளுக்காகக் கொடுக்கப்படும் தகவல்களைச் சொல்லிப் பயனில்லை; இவற்றைக் கொண்டு எதை உருவாக்க வேண்டும் என்பதை குழுமங்கள் பெரும்பாலும் நிர்ணயிக்கின்றன. இதனால், பக்கச் சார்புகளும், தரக் குறைவுகளும் இடம் பெறுகின்றன. சில இன, நிற, பால் பேதங்களைக் குறித்தான அவதூறுகளைக் களையும் வண்ணம் செயலமைத்திருப்பதாக ப்ரிஸ்மா லேப்ஸ் சொன்னாலும், விவரங்கள் தரப்படவில்லை. NSFW,(Not Safe For Work) ‘பாதுகாப்பானதில்லை’ என்ற வடிகட்டிகளை லயன் நிறுவியிருக்கிறது.

காலம் போகப் போக இன்னமும் கூட ஆபாசமான வரைபடங்கள் நம் சுயமிகளை வைத்து உருவாகலாம். ஆனால், அது தொழில் நுட்பத்தின் கோளாறல்ல; மனித வக்கிரத்தின் முகம்.

செயற்கை அறிவின் பெரும் மொழி மாதிரிகளும், அவைகளின் போதாமைகளும்

சேட்ஜிபிடியிடமிருந்து பெரும்பாலும் சிறிய கேள்விகளுக்கு சிறப்பாகவே பதில் வருகிறது. நேர்மறை கேள்விகளை கையாளத் தெரிந்த மாதிரி, எதிர்மறைக் கேள்விகளைக் கையாள முடிவதில்லை அதற்கு. இது மொழி வளத்தை கணக்கில் கொள்ளவில்லையோ என நினைக்கச் செய்கிறது. மொழியியல் வல்லுனர்கள் கவலை தரும் ஒன்றாக இதைக் குறிப்பிடுகிறார்கள். நல் மொழி, செம் மொழி, எதிர்க்கூற்று ஆகியவை அற்றுப் போய்விடும் சூழலைக் கொண்டு வருமோ என அஞ்சுகிறார்கள்.

சில தட்டச்சுப் பிழைகள், எழுத்துப் பிழைகள், கேள்வி அமைப்பு முறை பிழைகள் ஆகியவை இருந்தால், (கேள்வி கேட்பவர் செய்யும் தவறுகள்) மருத்துவ, அறிவியல் சார்ந்த வழிகாட்டுதலுக்கு, நம்பிக்கைக்குரிய பதில்கள் கிடைக்காதது மட்டுமல்ல, தவறான வழி காட்டுதலையும் கொடுக்கிறது. உதாரணமாக, குழந்தைகளின் செரிமான சக்திக்கு, தாய்ப்பாலில் நொறுக்கப்பட்ட பீங்கான் துகளை உபயோகிக்கலாம் என்று சேட்ஜிபிடி சொல்லியிருக்கிறது(!)

இதில் அதை அமைத்த பொறியாளரின் பங்கு என்ன, அவரது பொறுப்பு என்ன என்பதே சிக்கலான கேள்வி. தரவுகள் அலசப்பட்டு, சரி பார்க்கப்பட்டு, முன்னோட்டம் விடப்பட்டு, பின்னூட்டம் பெறப்பட்டு, பின்னர் வெளி வந்தால் நலம். ஆனால், பயிற்சியாளர், தகவல்கள் பெறப்பட்ட தளங்கள், அதன் உள்ளீட்டில் இடம் பெறும் சாத்தியங்களுள்ள மனிதப் பிழைகள் ஆகியவை பற்றி எந்த ஒரு வினாவும், விவாதமும் எழவில்லை. பொது சமுதாயம் என்ற ஒற்றைப் பதிலில் கேள்விகள் மூழ்கடிக்கப்படுகின்றன என்று அறிவியல் அறிஞர்கள்,(கலாக்டிக்கா- அது சேட்ஜிபிடி போன்ற ஒரு அறிவியல் மாதிரி) வருந்துகிறார்கள். நவ 17 முதல் கலாக்டிகாவின் செயல்பாடு நிறுத்தி வைக்கப்பட்டுள்ளது.

சேட்ஜிபிடி மனிதனுக்குகந்த சாதனம். அது நம் மொழியில் உரையாடுகிறது. தொலைக் காட்சி, இணையம், காணொலிகளுடன் நாம் நிகழ்வின் நடுவே உரையாட முடியாது. பின்னரும் கூட கருத்துக்களை மட்டும் தான் சொல்ல முடியும். சேட்ஜிபிடி அப்படியல்ல. அது உங்கள் அலைபேசியில் இருக்கும் பல்திறன் களஞ்சியம், உரையாடும் நண்பன், வழிகாட்டும் ஆசிரியர், கற்றுக் கொள்ளும் சீடன், செல்லக் குழந்தை, மீள மீளக் கேட்டாலும் அலுத்துக் கொள்ளாத உறவு, பாரதி கண்ணனைப் பற்றி பாடியதைப் போல், நண்பனாய், சேவகனாய் என்று சொல்லிக் கொண்டே போகலாம்.

நிறைகளை எடுத்துக் கொள்வது, குறைகளைக் களைவது வளர்ந்து வரும் தொழில்நுட்பக் காலத்திற்கு அவசியம். மேம்படுத்த வேண்டும், ஆனால், புறக்கணிப்பு கூடாது.

‘கற்பதுவே, கேட்பதுவே, கருதுவதே, நீங்கள் எல்லாம் அற்ப மாயைகளோ, உம்முள் ஆழ்ந்த பொருளில்லையோ?’- பாரதி

உசாத்துணை:

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.