Toate informațiile de care ai nevoie înainte să cumperi o locuință nouă!
Cum compunem textele

Cum compunem textele

De câteva secole producem și consumăm conținut în același fel, variază doar metoda de livrare. Presa (tipografia) este astăzi la fel de relevantă ca în secolul al XV-lea în sensul că textul e întipărit sub o formă sau alta (fizic, pe hârtie sau virtual, în octeți) și apoi e citit exact în forma în care a fost inițial întipărit. Fie că citim un ziar, fie că citim o postare pe Facebook, acel text pe care îl vedem este exact textul pe care autorul l-a compus.

În 2017 a început schimbarea, odată cu apariția arhitecturii bazată pe ”transformer”, descrisă inițial în lucrarea ”Attention Is All You Need” (Ashish Vaswani, Google Brain). Lectura acestei lucrări ne-a determinat să cercetăm NLP și să facem ceea ce astăzi se numește ”AI”. Încă de atunci am înțeles revoluția pe care respectiva tehnologie o va aduce și, deși a avut un progres lent inițial, astăzi ”transformerele” schimbă lumea în care trăim.

Printre altele, această arhitectură a permis crearea unui mecanism care avea capacitatea de a identifica și asocia entități și, deci, înțelege limbajul natural. Cu cât setul de date era mai mare, cu atât mecanismul devenea mai performant. Astfel, a luat naștere seria de modele GPT (Generative Pre-Trained Transformers), care au dus la mașini din ce în ce mai performante în prelucrarea, asimilarea și generarea de limbaj natural.

În 2023, odată cu LLM-ul GPT-3.5, am pășit într-o nouă era a informației, am trecut de la textul întipărit la textul intepretat iar odată cu GPT-4, mașinile au dobândit capacitatea de a face inferențe din ce în ce mai complexe. Progresul a fost fulminant, în toamna lui 2023 fiind prezentate primele sisteme multimodale care, pe lânga abilitatea de a interpreta imagini, au prezentat și ceea ce pare a fi Theory of Mind – mașini care empatizează. Dacă în 2022, termenul AGI era luat în derâdere, astăzi stă pe buzele celor mai mari cercetători din lume.

Revenind la modul în care creăm și consumăm conținut, în viitor, aproape niciun fragment de text nu va fi citit exact cum a fost scris de autor ci vom citi o adaptare a lui, croită special pe înțelesul nostru. Croiala o fac mașini care au ajuns să ne cunoască, să ne știe limitele, interesele, ceea ce ne face să zâmbim, ceea ce ne întristează, mașini care au menirea să ne ajute să ne dezvoltăm înțelegând mai bine informația pe care o consumăm.

eDezvoltator este printre primele site-uri din România care încorporează aceste noi forme de conținut iar în acest articol vom explica exact cum o facem.

Informații din șantier

Înainte de a discuta de conținut, trebuie să vorbim despre informații, conținutul fiind doar o transpunere a unor informații. Colectăm informații (date) în mod empiric, observând. În ceea ce privește ansamblurile, facem audit-uri la șantier; în ceea ce privește locuințele, facem segmentarea lor; în ceea ce privește utilizatorii, le analizăm comportamentul pe site. Toate aceste analize se transpun în date care apoi merg către antrenarea mașinilor.

Inițial informațiile sunt traduse în limbajul mașinilor (vectorizate) și apoi sunt introduse într-un sistem bazat pe transformeri (bidirecționali – BERT) care ”antrenează creierul” site-ului nostru – un LLM intern, bazat pe Anthropic Claude 2 și GPT-4. Mai departe, mașinile generază conținutul descris în secțiunile următoare.

Conținut fundamental

Numim conținut fundamental acele texte statice care sunt create și consumate în forma inițială, fără a fi modificate în mod dinamic. Acestea sunt produse de mașini și editate de oameni. Aici ne referim la ”conținutul clasic”, cel la care au acces toți utilizatorii noștri, cel care trebuie parcurs complet pentru a fi corect înțeles.

Acest tip de conținut este reprezentat în special de opiniile experților pe care le publicăm la fiecare locuință sau ansamblu.

Opiniile sunt generate pe baza a două tipuri de factori:

  1. Factori absoluți. Aceștia nu sunt contextuali, de exemplu, în cazul paginilor de ansambluri, vorbim de calitatea generală a materialelor de construcții folosite sau, în cazul locuințelor, de configurația spațiului locuibil.
  2. Factori relativi. Aceștia iau în calcul contextul local, de exemplu, nu penalizăm un ansamblu care nu are parc/spații verzi în interior dar are un parc în imediata apropiere.

Există combinații complexe ai acestor factori în sensul că diferă în funcție de poziția ansamblului față de centrul orașului sau de nivelul de preț al ansamblului.

Pentru a facilita evaluarea factorilor enumerați mai sus, mașina emite și un calificativ de la 1 la 5 însă trebuie luat în calcul că acest calificativ este calculat ”la rece”, adică nu ține cont de preferințele exacte ale utilizatorului.

Conținut dinamic

Cei care își fac un cont pe eDezvoltator, primesc acces la un alt conținut decât cel fundamental. Practic, ordinea filtrelor, ordinea locuințelor și toate textele sunt acum personalizate conform profilului clientului setat la deschiderea contului.

De exemplu, dacă utilizatorul a menționat că este mai important să aibă o locuință luminoasă decât o locuință ieftină, catalogul va prezenta cele mai luminoase locuințe primele, în limita bugetului indicat de client. Textele de opinii și cele de prezentare se vor schimba și vor conține mai multe informații despre iluminatul natural. Până și imaginile locuințelor își vor schimba ordinea pentru a afișa mai întâi randările care simulează proiecția luminii naturale.

Astfel, tot conținutul site-ului va fi croit pentru a-i facilita utilizatorului identificarea rapidă a celei mai potrivite locuințe, conform preferințelor personale. Această ”croială„ se va face pe baza unui chestionar pe care utilizatorul este rugat să îl completeze pentru a beneficia de funcțiile dinamice.

Cu toate acestea, utilizatorul tot va fi nevoit să parcurgă liste lungi de unități precum și texte voluminoase – opinii și prezentări. Cei care nu au timpul necesar pentru a face o cercetare atât de detaliată, pot apela la asistentul virtual, descris mai departe.

Conținut generativ

Considerăm că acest ultim tip de conținut este cel către care va tranzita întreg Internetul în următorii ani. Este cel mai eficient din punct de vedere evoluțional în sensul că utilizatorul ajunge la rezultatul dorit cu cel mai mic consum de energie. Drept urmare, este natural ca acest tip de conținut să fie și cel mai căutat.

Conținutul generativ este de fapt o conversație. Nu presupune niciun punct de pornire și niciun rezultat predefinit. Este un dialog între utilizator și mașină în care omul prezintă probleme (de exemplu ”caut un apartament aproape de metrou, cu un buget maxim de 80.000 EUR, bine iluminat, la un etaj intermediar, cu loc de parcare inclus”) și mașina oferă soluții imediate (o listă cu cele mai relevante locuințe). Apoi, pe măsură ce dialogul avansează, mașina devine din ce în ce mai conștientă de preferințele omului iar recomandările devin din ce în ce mai relevante.

Practic, astfel utilizatorii obțin acces la cel mai bun și cel mai disponibil agent imobiliar din piață. El cunoaște fiecare detaliu al oferte și va răspunde obiectiv la orice întrebare, va analiza imagini de la șantiere (furnizate de utilizator), va analiza compartimentări și va putea face comparații de oferte și multe altele. Toate acestea în timp real, pe baza unui dialog purtat cu utilizatorul pe eDezvoltator.ro.

Acest tip de conținut nu poate exista fără cel fundamental, deci conținutul generativ nu elimină nevoia de conținut fundamental, doar îi schimbă natura. Nu vom mai citi aproape niciodată un text în forma lui inițială, cel puțin nu unul informativ/util. Vom citi doar interpretări ale textului orginal, interpretări adaptate la nivelul nostru de cunoaștere, la limbajul nostru, la curiozitățile noastre.

Ți-a plăcut articolul? Împarte-l cu alții!
Link articol
Articolul anterior

Cum construim catalogul

Articolul următor

Viorel, asistentul virtual eDezvoltator

Recomandăm și...