Lendo e relendo: Albertina, a IA que gera textos sobre quaisquer temas em Português

Albertina, a primeira inteligência artificial (IA ou AI, em Inglês) que pesquisa e produz textos em Português sobre qualquer tema, foi lançada, a 19 de maio, com um módulo de 900 milhões de parâmetros e, em julho, trará um modelo que percebe Português europeu e brasileiro.

A iniciativa (com a escolha do nome) é de investigadores da Faculdade de Ciências da Universidade de Lisboa (FCUL) e da Faculdade de Engenharia da Universidade do Porto (FEUP) e aponta o futuro com o primeiro modelo de inteligência artificial generativa (IAG), que permite produzir, de forma autónoma, textos com vários temas na Língua Portuguesa.

Entre os dias 19 e 22, a Albertina foi descarregada 33 vezes – número não tão reduzido, se se tiver em conta que a ferramenta foi desenhada para correr em servidores (computadores empresariais) de grande capacidade. E, em julho, o projeto ficará concluído com um módulo conhecido por GPT-PT, inteiramente grátis, como a Albertina.

Para António Branco, professor da FCUL, a Albertina é o primeiro modelo de processamento de linguagem para Português, disponibilizado publicamente para atividades académicas e comerciais, sem custos e com o código aberto (os produtores disponibilizam estrutura e códigos de programação). E as grandes marcas tecnológicas têm algo do género, pois conseguem lidar com o Português, mas não disponibilizam esses modelos livremente.

O ChatGPT – assistente virtual inteligente no formato chatbot online com IA, desenvolvido pela OpenAI, especializado em diálogo, lançado em novembro de 2022 – é o caso mais famoso do que é possível fazer com os grandes modelos de processamento de linguagem (GPT), que usam a IA para gerar textos a partir de grandes repositórios de dados. A Albertina chega com a expectativa de abrir caminho a ferramentas similares ao ChatGPT, criado a partir dos GPT produzidos pela OpenAI (GPT 3.5, ou mais recentemente GPT 4). E funciona como recurso tecnológico que serve de base ao desenvolvimento de várias ferramentas, que produzem conteúdos úteis para o comum dos utilizadores, como sumários, traduções, classificação de texto consoante as emoções, diálogos com pessoas (e assistentes digitais), legendagem automática, entre outras coisas.

Os 33 downloads efetuados levam a crer que, para efeitos académicos e comerciais, a Albertina já começou a ser explorada para o desenvolvimento de novos produtos e tecnologias. E António Branco, depois de referir que já existia, na variante brasileira, um protótipo bem “mais pequeno”, sendo a Albertina o primeiro GPT em Português europeu, considera este lançamento um marco histórico com significado comparável ao da primeira gramática para o Português, pelo que é um reforço da soberania linguística.

O projeto foi desenvolvido no âmbito do consórcio Accelerate.AI, que recebeu 35 milhões de euros para o desenvolvimento de diferentes projetos, ao abrigo do Programa de Recuperação e Resiliência (PRR). Na IAG, o Accelerate.AI prevê o desenvolvimento de um codificador e de um descodificador. O codificador é a Albertina. O descodificador é o já mencionado GPT-PT, que sairá em julho pelas mãos dos investigadores da FCUL. Ambos podem fazer o mesmo, mas, enquanto a Albertina requer treinos mais intensivos e especializados em diferentes temáticas, o GPT-PT tem um treino básico que lhe permite adaptar-se mais facilmente a qualquer temática para produzir textos de forma autónoma, com margens de erro menores. A Albertina exige mais treino, por estar assente numa rede neuronal de menor dimensão; e o GPT-PT, por ter rede neuronal maior e mais complexa, aprende mais rapidamente a produzir dados.

Há um traço em comum entre codificador e descodificador: a produção de resultados sem os humanos terem de inserir regras de processamento de dados e produção de conteúdos. A Albertina está assente numa rede neuronal artificial que funciona da mesma forma como os neurónios se interligam. Dentro de um cérebro, essas interligações são feitas por sinapses, mas num GPT são conhecidas por parâmetros ou valores estatísticos que definem como um GPT interpretará o mundo ou, pelo menos, as abordagens que seguirá para o processamento da informação.

Em codificadores como a Albertina, o treino pode ser feito ao longo do tempo e varia consoante a temática. Num descodificador como o GPT-PT o treino resume-se à fase de preparação – e não há que voltar ao treino na fase de operacionalidade. Em ambos casos, o conceito tem por ponto de partida a introdução de textos processados a partir da identificação de padrões estatísticos que ajudam a compreender os significados, a sintaxe, contextos ou episódios históricos. E, com base nesta capacidade, os GPT produzem textos adivinhando, através das probabilidades estatísticas, as palavras que faltam para compor uma frase ou um texto inteiro sobre tema à escolha.

A livre distribuição destas ferramentas pode ser aproveitada por cibercrime ou brincadeiras de mau gosto, mas o projeto segue as melhores práticas: este processo de distribuição gratuita já foi feito para Inglês, para Espanhol ou para Francês.

António Branco recorda que os codificadores de Língua Inglesa têm um número de parâmetros similar aos 900 milhões da Albertina, mas admite que, nos descodificadores, em que se há de enquadrar o futuro GPT-PT, o número de parâmetros é maior, como sucedeu com o GPT 3.5 (175 mil milhões), que está na origem dos primeiros casos de sucesso do ChatGPT, da OpenAI.

“Já foi lançado o GPT 4 pela OpenAI, mas nunca foi publicado um artigo a explicar como funciona e ninguém conhece as caraterísticas técnicas”, recorda António Branco, reforçando a defesa da soberania linguística, face aos projetos das grandes marcas de tecnologias.

A Albertina foi treinada com textos redigidos em Português europeu e brasileiro. Em qualquer dos casos, a eficiência na busca e no processamento de informação depende da quantidade de dados disponíveis. “Admito que não vamos conseguir levar o GPT-PT a ter a mesma dimensão dos GPT da OpenAI. E não é por uma questão técnica ou de falta de recursos, mas sim por não haver, na Internet, tantos textos disponíveis em Português, como há atualmente para Inglês”, conclui o investigador da FCUL. Em julho se verá o que traz o GPT-PT.

***

O cofundador da Microsoft, Bill Gates, antevê o surgimento num futuro próximo de uma aplicação de IA que mudará completamente o comportamento do utilizador e erradicará ferramentas atualmente populares, como motores de busca ou lojas ‘online’. Este assistente de IA, que ainda não foi desenvolvido, entenderá as necessidades e hábitos de uma pessoa e acabará com o uso da Internet como a conhecemos.

Na luta pela liderança para criar a melhor ferramenta generativa baseada em IA, estão gigantes da tecnologia como a Google, com o Bard, a Microsoft, com o Bing, e ‘startups’ como OpenAI, com ChatGPT. “Nunca mais iremos a um site de pesquisa, nunca mais iremos a um site de produtividade ou à Amazon”, destacou Bill Gates num evento da Goldman Sachs e SV Angel, em São Francisco, sobre a IA. Por isso, “o mais importante é quem ganha um agente pessoal”, acrescentou. Sobre que empresa criará tal assistente, Bill Gates realçou que ficaria desapontado, se a Microsoft não “interviesse”. Porém, afirmou-se impressionado com algumas ‘startups’, como a Inflection.AI, cofundada pelo ex-executivo da DeepMind Mustafá Suleyman.

***

A IA é a capacidade da máquina para reproduzir competências semelhantes às humanas como o raciocínio, a aprendizagem, o planeamento e a criatividade. Leva a que os sistemas técnicos percebam o ambiente que os rodeia, lidem com o que percebem e resolvam problemas, agindo para um objetivo específico. O computador recebe dados (preparados ou recolhidos pelos seus sensores, por exemplo, uma câmara), processa-os e responde. Os sistemas de IA adaptam o seu comportamento, através da análise dos efeitos das ações anteriores e de um trabalho autónomo.

Tecnologias de IA existem há mais de 50 anos, mas o melhor desenvolvimento da capacidade de processamento, a disponibilidade de quantidades elevadas de dados e novos algoritmos permitiram grandes progressos da IA nos últimos anos.

A IA é considerada primordial para a transformação digital da sociedade e tornou-se uma prioridade da União Europeia (UE). Estão previstas futuras aplicações que trarão mudanças enormes, mas a IA já está bem presente no nosso quotidiano. Vejamos:

Nas compras e na publicidade online, a IA fornece recomendações personalizadas às pessoas, com base, por exemplo, nas suas pesquisas e compras anteriores ou noutro comportamento online, bem como otimiza os produtos, faz planeamento e inventários, organiza a logística, etc.

Os motores de busca aprendem com a vasta entrada de dados, providenciados pelos seus usuários, para fornecer resultados de pesquisa relevantes. Os smartphones usam IA para fornecer um produto o mais relevante e personalizado possível. Os assistentes virtuais que respondem a perguntas, fornecem recomendações e ajudam a organizar rotinas tornam-se omnipresentes.

O software de tradução linguística, baseado em texto escrito ou falado, confia na IA, para fornecer e melhorar traduções, bem como para proceder à legendagem automática.

Termóstatos inteligentes aprendem com o nosso comportamento para economizar energia, enquanto os desenvolvedores de cidades inteligentes controlam o tráfego para melhorar a conectividade e reduzir os engarrafamentos. Enquanto os veículos autónomos não são realidade, os carros usam funções de segurança alimentadas por IA. A UE ajudou a financiar o VI-DAS, projeto relativo a sensores automatizados que detetam situações perigosas e acidentes. A navegação é, em grande parte, alimentada por IA. Os sistemas de IA reconhecem e combatem os ataques cibernéticos e outras ameaças cibernéticas com base na introdução de dados, no reconhecimento de padrões e no retrocesso dos ataques.

Na covid, a IA é usada no controlo térmico em aeroportos e em outros lugares. Na medicina, a IA ajuda a reconhecer a infeção através das radiografias computadorizadas da tomografia dos pulmões e é usada para fornecer dados para localizar a propagação dos vírus. Os investigadores pesquisam como podem usar IA para analisar grandes quantidades de dados de saúde e para encontrar padrões que levem a novas descobertas em medicina e a outras formas de melhorar o diagnóstico individual. Por exemplo, desenvolveram um programa de IA para atender chamadas de emergência e que reconhece uma paragem cardíaca, durante a chamada, de modo mais rápido e com maior frequência, em comparação com o envio de equipa médica. E o Kconect, projeto cofinanciado pela UE, desenvolve serviços de pesquisa e texto multilingues para auxiliar as pessoas a encontrar as informações médicas disponíveis e mais relevantes. Só importa acautelar, na saúde, a privacidade das pessoas e o sigilo médico, como recomenda a Organização Mundial da Saúde (OMS).

Certas aplicações de IA detetam notícias falsas e desinformação, através do controlo das informações nas redes sociais, da procura de palavras sensacionalistas ou alarmantes e da identificação das fontes fidedignas.

A IA melhora a segurança, a velocidade e a eficiência do tráfego ferroviário, ao minimizar o atrito das rodas, maximizar a velocidade e possibilitar uma condução autónoma, tal como ajuda os fabricantes a tornarem-se mais eficientes e a trazer as fábricas de volta à Europa, através da utilização de robôs na fabricação, da otimização dos caminhos de vendas ou da previsão em tempo real da manutenção e falhas em fábricas inteligentes.

O Satisfactory é um projeto de investigação cofinanciado pela UE, que usa sistemas de realidade aumentada e colaborativos para acrescer a satisfação no trabalho em fábricas inteligentes.

A IA, na criação de sistemas alimentares sustentáveis, garante alimentos saudáveis, minimizando a utilização de fertilizantes, de pesticidas e de irrigação, e contribui para a produtividade e para a redução do impacto ambiental. Os robôs removem ervas daninhas. Por isso, muitas explorações agrícolas na UE já utilizam a IA para monitorizar o movimento, a temperatura e o consumo de alimentos pelos animais.

Usando uma vasta gama de dados e de reconhecimento de padrões, a IA alerta antecipadamente para as catástrofes naturais e permite a preparação e atenuação eficientes das consequências.

E a IA é largamente usada na administração pública (fisco, segurança social, educação, defesa, administração interna, etc.), incluindo a administração da Justiça (otimizando a investigação e a análise, mas sem dispensar a inteligência e a mão humana humanas).

***

Se o governo e o Parlamento usassem mais a IA, não haveria tantos “casos e casinhos”.

2023.05.24 – Louro de Carvalho

Lendo e relendo

quarta-feira, 24 de maio de 2023

Albertina, a IA que gera textos sobre quaisquer temas em Português

Sem comentários:

Enviar um comentário