சொல்வனம் 284-வது இதழில் ‘சொல்லவல்லாயோ, கிளியே?’ என்ற தலைப்பில் சேட்ஜிபிடியைப் பற்றிப் பார்த்தோம். இந்தக் கட்டுரையில் அதன் சில அம்சங்களையும், நேரக்கூடும் என நினைக்கும் பாதகங்களையும் பார்க்கலாம். செயற்கை நுண்ணறிவின் பாதகங்களும் அடங்கிய ஒன்றுதானல்லவா இது?
ஓரு கேள்வி சேட்ஜிபிடியிடம் கேட்கப்பட்டது:
‘புது உணர்விற்கான சொல்லைத் தருவாயா?’
“சொல்ல முடியுமே! மிகத் துல்லிய இசை அமைப்பு கொண்ட அரங்கத்தில் நிகழும் ஒரு இசை நிகழ்ச்சியால் நீங்கள் மகிழ்வீர்கள் என்று நினைத்து அங்கே போவீர்கள்; சிலது மகிழ்வாகவும், சிலது பிடிக்காமலும் ஆகும்; அந்த நிலையை “முழு ஈர்ப்பில்லா நிகழ்ச்சி” என்று சொல்வதற்கு ‘மெ(ஹ்)வெல்ம்ட் (Mehwhelmed) என்ற ஒரு சொல்லைப் பயன்படுத்துவது உங்கள் உணர்வைக் காட்டும்.”

சேட்ஜிபிடியும், கல்வித் துறையும்
சேட்ஜிபிடி ஒரு ‘பெரிய மொழி மாதிரி’ (Large Language Model) என நீங்கள் அறிவீர்கள். நீங்கள் கொடுக்கும் சொற்களைக் கொண்டு, தூண்டும் கேள்விகளைக் கொண்டு, இயற்கை மொழியில் துல்லியமாக உரையாடும் இது, உண்மையில் செயற்கை நுண்ணறிவால் இயங்குகிறது. மனிதர்களைப் போலவே இதன் பதில் இருப்பதில் இதன் வெற்றி அடங்கியுள்ளது. அது மட்டுமல்ல, மிகக் கடுமையான போட்டித் தேர்வுகளில் மனிதனை விட சிறந்த பதிலளித்து வெல்லும் சாதனம் இது. இங்கேதான் எழுகிறது சிக்கல். ஏனெனில், தேர்வெழுதுவோரின் உண்மையான அறிவுத் திறம் வெளிப்படாமல் போகும் அபாயம் உள்ளது. கோவிட்-19 காலத்திலேயே நிகழ்நிலைத் தேர்வுகளில், மாறாட்டம் அதிக அளவில் நடைபெற்றது. இன்று உலகம் இருக்கும் நிலையில், இன்னமும், தொற்றின் பல்வேறு அவதாரங்களில் பல நாடுகள் சிக்கித் தவிக்கையில், நிகழ்நிலைத் தேர்வுகள் தொடரும் கட்டாயத்தில் ‘எழுதியது, கிளியா, மாணவமணியா?’ எனக் கண்டுபிடிப்பது கடினம். கல்வித்துறையில் அறமீறல் நடை பெறலாம்.
சேட்ஜிபிடியால் எந்த அளவிற்குக் கடினமான கேள்விகளை (கல்வி சார்ந்த) உருவாக்கிக் கொள்ள முடியும், பதிலளிக்க முடியும் என்று ஒரு ஆய்வு மேற்கொள்ளப்பட்டது. அது தெளிவான, சரியான, துல்லியமான, பொருத்தமான, ஆழமும், அகலமுமான, தர்க்கத்துடன் பொருந்தக்கூடியதான, உண்மையான (மூலமான) கேள்விகளையும் சிந்தித்து- பதில்களையும் சொல்லியது- மேலும் அதில் கேள்விகள் கேட்க இடமும் அளித்து பதில் சொல்லும் திறனையும் காட்டியது. எனவே, இது தகவலைத் திரும்பத்தரும் சாதனம் மட்டுமல்ல, ஆழமாகச் சிந்திக்கவும் முடியும் இதனால். இந்த நிலைதான் கல்வியாளர்களிடையே கவலையை விதைத்துள்ளது.
மாணவர்கள் சேட்ஜிபிடியைக் கொண்டு தேர்வெழுதி வெற்றி பெறும் சாத்தியங்கள் அதிகமாகும் என்று கல்வியாளர்கள் அஞ்சுகிறார்கள். அப்படி நடக்காமலிருக்க என்ன செய்ய வேண்டும் என்று அதனிடமே கேட்கப்பட்டது.
- தூண்டுதல் சாதனங்களை/அதைப் போன்ற கருவிகளை மாணவர்கள் பயன்படுத்துவதை தடை செய்ய வேண்டும். (ஆய்வாளர்கள் கருத்து: அனைத்து வியாதிகளுக்குமான ஒரே மருந்து என இதை எடுத்துக் கொள்ள முடியாது.)
- வேறு வலைத்தளங்களிலிருந்தோ, அவற்றைப் போன்ற மற்றவற்றிலிருந்தோ அவர்கள் பதில்கள் பெறுவதை தடுக்கும் வண்ணம், தேர்வு அமைப்பாளர்கள், பாதுகாப்பான உலாவிகளைப் பயன்படுத்த வேண்டும். (ஆய்வாளர்கள் கருத்து: செலவு மிக்கது)
- திருட்டைக் கண்டுபிடிக்கும் மென்பொருள் செயலிகளைப் பயன்படுத்தி, சேட்ஜிபிடி அல்லது அதைப் போன்றவைகளைப் பயன்படுத்தும் மாணவர்களைக் கண்காணிக்கலாம். (ஆய்வாளர்கள் கருத்து: சேட்ஜிபிடியே ஒவ்வொரு தூண்டுதலுக்கும் தனிப்பட்ட பதில்களைத் தரும் திறம் கொண்டிருப்பதால், இந்த வழி உதவாது)
- மொழி இயந்திர செயற்பாடுகளைக் கொண்டு, செயற்கை நுண்ணாறிவினால்தான் மாணவர்கள் தேர்வு எழுதியுள்ளார்களா எனக் கண்டுபிடிக்கலாம். (ஆய்வாளர்கள் கருத்து: இந்த முறையிலும் சில இடர்கள் உண்டு. இவைகள் இன்னமும் வளர வேண்டும். மேலும், செலவு அதிகம் பிடிக்கும். பல பல்கலைகளால் நிறைவேற்ற முடியாது)
- மாணவர்களுக்கு நல்லறம் போதித்து, குறுக்கு வழியில் நிலைத்த வெற்றியில்லை என்று உணர வைக்கலாம். (ஆய்வாளர்கள் கருத்து: திருடராய் பார்த்து திருந்தாவிட்டால் திருட்டை ஒழிக்க முடியாது)

மேற்சொன்னவைகள் சேட்ஜிபிடி சொன்ன வழிமுறைகள். இந்த ஆய்வினை மேற்கொண்டவர்கள் சில வழிகளைச் சொல்கிறார்கள்:
- சேட்ஜிபிடி மனித மொழி சார்ந்தது. எனவே, வினாக்களில் உருவங்களையும் இணைத்து கேள்விகளை அமைக்கலாம்.
- முன்னரே பதிவு செய்த காணொலிகளில், உருவப் படத்துடன், சொற் கேள்வியையும் இணைக்கலாம்.
- நேரடியாக வினாக்களைத் தொடுக்கலாம்.
ஆனாலும், செயற்கை நுண்ணறிவு சொல், உருவம், மறைக்கப்பட்டுள்ள எழுத்து அனைத்தையும் அறியும் காலம் நெருங்கி வருகிறது.
செயற்கை நுண்ணறிவும், பெண் உடல்களின் கணினித் தோற்றங்களும்
‘லென்சா’ (LENSA) என்றொரு செயற்கை நுண்ணறிவு விண்ணப்பம் இருக்கிறது. அதில் நமது இலக்கத் தோற்றத்தை (Digital Image) நாம் அமைத்துக் கொள்ளலாம். அதாவது நாம் வெவ்வேறு அவதாரங்கள் எடுக்கலாம். இதில் ‘மேஜிக் அவதார்’ வந்திருக்கிறது; இதன் மூலம் நம் இலக்க உருவங்களை கற்பனைக்குத் தோன்றிய வண்ணம் எழுப்பிக் கொள்ளலாம். அதற்கு ஆதாரமாகத் தேவையானது சுயமி.(Selfie)
தனது ‘டெக்னாலஜி ரெவ்யூ கட்டுரையில், (டிச், 12,2022) மெலிசா ஹெய்க்கிலா (Mellisa Heikkila) சொல்கிறார்: இந்த லென்சா விண்ணப்பத்தைக் கொண்டு முயற்சி செய்து பார்க்கையில், அவரது விபரீதமான அவதாரங்கள் வந்துள்ளன. 100-ல், பதினாறு படங்களில் மேலுடம்பு ஆடையற்றும், 14-ல் தோல் வெளியே முழுதும் தெரியமாறு சல்லா போர்வை இட்டும், அழுவது போலும் பல படங்கள். அவருடன் பணி புரியும் ஆண்களின் படங்கள் மேன்மையாளராக, விண்வீர்ராக, சிறந்த விளையாட்டாளராகக் காட்டிய அதுவே, ஆசியப் பெண்களை, சீனப்பெண்களை தரக் குறைவாகக் காட்டியிருக்கிறது. ஆனால், வெள்ளைத் தோலினப் பெண்களை நாகரீகமாகக் காட்டியிருக்கிறது. ஆனாலும், வளைவுகளை விட்டுவிடவில்லை அது.(ஆண்களுக்கான உலகம்!) தன்னை ஒரு ஆணாகக் காட்டுமாறு கேட்ட போதும் அது கவர்ச்சியைக் கை விடவில்லை என்று அவர் எழுதுகிறார்.

லயன் 5 பி (LAION-5B) என்ற, இணையத்திலிருந்து துருவி எடுக்கப்பட்ட அனைவருக்கும் கிடைக்கும் வகைமையில்யுள்ள தகவலை, நிலையான பரவல் (Stable Diffusion) அமைப்பின் மூலம் லென்சா (Lensa) பெறுகிறது. இந்த ‘ஸ்டேபில் டிஃபூஷன்’, (Stable Diffusion) ‘ஸ்டேபில் செயற்கை நுண்ணறிவின்’ (Stable A I) கொடை. Contrastive Language Image Pretraining- CLIP-க்ளிப் என்ற அமைப்பு, நிலையான பரவலுக்கு, உருவப்படங்களை உருவாக்குவதில் உதவுகிறது. உள்ளிடப்பட்ட, விரிவான மொழித் தூண்டுதலால் பெறப்பட்ட, தகவற் களஞ்சியத்திலிருந்து அது உருவப் படங்களை ஒப்பு நோக்கிப் பார்த்து தேர்ந்தெடுக்கிறது. அந்த உள்ளிடப்பட்ட தகவல்கள், இனம் மற்றும் பாலினம் சார்ந்து, நியாயமற்ற சார்பெடுத்து பேதங்களைக் கக்குகிறது. இணையத்திலோ, தரக்குறைவான பல அழகிகளின் படங்கள், அவர்களின் இனம், நிறம், போன்றவை கொட்டிக் கிடக்கின்றன. இனம், மொழி, நாடு என்று வகை வகையாகத் தென்படுகின்றன. இதுதான் நிரந்தரப் பரவல் தன் இடு பொருளைச் சேகரிக்கும் இடம். அது லென்சாவில் இடம் பெறுகிறது. விளைவு, வெள்ளையர் அல்லாத பெண் இனம், அதுவும் யுவதிகள் பாதிக்கப்படுகின்றனர்.
செயற்கை நுண்ணறிவு அமைப்பில் இடம் பெறும் பேதங்களைப் பற்றி வாஷிங்டன் பல்கலையில் பணி புரியும் அயலின் காலிஸ்கென், (Aylin Caliskan) பெண்கள், தாங்கள் அப்படிக் காட்டப்படுவதை விரும்பாத போதிலும், அவர்களை அப்படிக் காட்டும் வண்ணமே உள்ளீடுகள் உள்ளதாகத் தெரிவிக்கிறார். அடிப்படைக் காரணம் லயன் 5 பி ஒரு திறந்த தகவல் திரட்டாக இருப்பதுதான். இதில் ஓபன்-ஏ ஐயின் (Open-AI) டால்-இ, (Dall-E) கூகுளின், ‘இமேஜென்’ (Imagen) ஒன்றும் தரம் கூடியவை அல்ல. அவைகளில் திறந்த மூல இடுகைப் பொருள் கிடையாது என்றாலும், அவைகளும் இந்த லென்சாவைப் போலத்தான்.
மெலிசா சொல்கிறார் அவரது சுயமிகள் ஆண் உள்ளடக்க வடிகட்டியில் அனுப்பப்பட்ட போது, நாகரீகத் தோற்றத்துடன், வெள்ளை கோட்டுடன் உருவமைந்து வந்ததாம்.
கார்னிஜீ பல்கலையின் முனைவர் பட்ட ஆய்வு மாணவரான ரயன் ஸ்டீட் (Ryan Steed) சொல்கிறார்: இயந்திரப் பயிற்சிகளுக்காகக் கொடுக்கப்படும் தகவல்களைச் சொல்லிப் பயனில்லை; இவற்றைக் கொண்டு எதை உருவாக்க வேண்டும் என்பதை குழுமங்கள் பெரும்பாலும் நிர்ணயிக்கின்றன. இதனால், பக்கச் சார்புகளும், தரக் குறைவுகளும் இடம் பெறுகின்றன. சில இன, நிற, பால் பேதங்களைக் குறித்தான அவதூறுகளைக் களையும் வண்ணம் செயலமைத்திருப்பதாக ப்ரிஸ்மா லேப்ஸ் சொன்னாலும், விவரங்கள் தரப்படவில்லை. NSFW,(Not Safe For Work) ‘பாதுகாப்பானதில்லை’ என்ற வடிகட்டிகளை லயன் நிறுவியிருக்கிறது.
காலம் போகப் போக இன்னமும் கூட ஆபாசமான வரைபடங்கள் நம் சுயமிகளை வைத்து உருவாகலாம். ஆனால், அது தொழில் நுட்பத்தின் கோளாறல்ல; மனித வக்கிரத்தின் முகம்.

செயற்கை அறிவின் பெரும் மொழி மாதிரிகளும், அவைகளின் போதாமைகளும்
சேட்ஜிபிடியிடமிருந்து பெரும்பாலும் சிறிய கேள்விகளுக்கு சிறப்பாகவே பதில் வருகிறது. நேர்மறை கேள்விகளை கையாளத் தெரிந்த மாதிரி, எதிர்மறைக் கேள்விகளைக் கையாள முடிவதில்லை அதற்கு. இது மொழி வளத்தை கணக்கில் கொள்ளவில்லையோ என நினைக்கச் செய்கிறது. மொழியியல் வல்லுனர்கள் கவலை தரும் ஒன்றாக இதைக் குறிப்பிடுகிறார்கள். நல் மொழி, செம் மொழி, எதிர்க்கூற்று ஆகியவை அற்றுப் போய்விடும் சூழலைக் கொண்டு வருமோ என அஞ்சுகிறார்கள்.
சில தட்டச்சுப் பிழைகள், எழுத்துப் பிழைகள், கேள்வி அமைப்பு முறை பிழைகள் ஆகியவை இருந்தால், (கேள்வி கேட்பவர் செய்யும் தவறுகள்) மருத்துவ, அறிவியல் சார்ந்த வழிகாட்டுதலுக்கு, நம்பிக்கைக்குரிய பதில்கள் கிடைக்காதது மட்டுமல்ல, தவறான வழி காட்டுதலையும் கொடுக்கிறது. உதாரணமாக, குழந்தைகளின் செரிமான சக்திக்கு, தாய்ப்பாலில் நொறுக்கப்பட்ட பீங்கான் துகளை உபயோகிக்கலாம் என்று சேட்ஜிபிடி சொல்லியிருக்கிறது(!)
இதில் அதை அமைத்த பொறியாளரின் பங்கு என்ன, அவரது பொறுப்பு என்ன என்பதே சிக்கலான கேள்வி. தரவுகள் அலசப்பட்டு, சரி பார்க்கப்பட்டு, முன்னோட்டம் விடப்பட்டு, பின்னூட்டம் பெறப்பட்டு, பின்னர் வெளி வந்தால் நலம். ஆனால், பயிற்சியாளர், தகவல்கள் பெறப்பட்ட தளங்கள், அதன் உள்ளீட்டில் இடம் பெறும் சாத்தியங்களுள்ள மனிதப் பிழைகள் ஆகியவை பற்றி எந்த ஒரு வினாவும், விவாதமும் எழவில்லை. பொது சமுதாயம் என்ற ஒற்றைப் பதிலில் கேள்விகள் மூழ்கடிக்கப்படுகின்றன என்று அறிவியல் அறிஞர்கள்,(கலாக்டிக்கா- அது சேட்ஜிபிடி போன்ற ஒரு அறிவியல் மாதிரி) வருந்துகிறார்கள். நவ 17 முதல் கலாக்டிகாவின் செயல்பாடு நிறுத்தி வைக்கப்பட்டுள்ளது.
சேட்ஜிபிடி மனிதனுக்குகந்த சாதனம். அது நம் மொழியில் உரையாடுகிறது. தொலைக் காட்சி, இணையம், காணொலிகளுடன் நாம் நிகழ்வின் நடுவே உரையாட முடியாது. பின்னரும் கூட கருத்துக்களை மட்டும் தான் சொல்ல முடியும். சேட்ஜிபிடி அப்படியல்ல. அது உங்கள் அலைபேசியில் இருக்கும் பல்திறன் களஞ்சியம், உரையாடும் நண்பன், வழிகாட்டும் ஆசிரியர், கற்றுக் கொள்ளும் சீடன், செல்லக் குழந்தை, மீள மீளக் கேட்டாலும் அலுத்துக் கொள்ளாத உறவு, பாரதி கண்ணனைப் பற்றி பாடியதைப் போல், நண்பனாய், சேவகனாய் என்று சொல்லிக் கொண்டே போகலாம்.
நிறைகளை எடுத்துக் கொள்வது, குறைகளைக் களைவது வளர்ந்து வரும் தொழில்நுட்பக் காலத்திற்கு அவசியம். மேம்படுத்த வேண்டும், ஆனால், புறக்கணிப்பு கூடாது.
‘கற்பதுவே, கேட்பதுவே, கருதுவதே, நீங்கள் எல்லாம் அற்ப மாயைகளோ, உம்முள் ஆழ்ந்த பொருளில்லையோ?’- பாரதி
உசாத்துணை:
- Susnjak, T. (2022). ChatGPT: The End of Online Exam Integrity? arXiv.
- The viral AI avatar app Lensa undressed me—without my consent: My avatars were cartoonishly pornified, while my male colleagues got to be astronauts, explorers, and inventors.
- ChatGPT, Galactica, and the Progress Trap : When large language models fall short, the consequences can be serious. Why is it so hard to acknowledge that?