Albertina, a primeira inteligência artificial (IA ou AI, em Inglês) que
pesquisa e produz textos em Português sobre qualquer tema, foi lançada, a 19 de
maio, com um módulo de 900 milhões de parâmetros e, em julho, trará um modelo
que percebe Português europeu e brasileiro.
A iniciativa (com a escolha do nome) é de investigadores da Faculdade de
Ciências da Universidade de Lisboa (FCUL) e da Faculdade de Engenharia da
Universidade do Porto (FEUP) e aponta o futuro com o primeiro modelo de
inteligência artificial generativa (IAG), que permite produzir, de forma
autónoma, textos com vários temas na Língua Portuguesa.
Entre os dias 19 e 22, a Albertina foi descarregada 33 vezes – número não
tão reduzido, se se tiver em conta que a ferramenta foi desenhada para correr
em servidores (computadores empresariais) de grande capacidade. E, em julho, o
projeto ficará concluído com um módulo conhecido por GPT-PT, inteiramente grátis,
como a Albertina.
Para António Branco, professor da FCUL, a Albertina é o primeiro modelo de
processamento de linguagem para Português, disponibilizado publicamente para
atividades académicas e comerciais, sem custos e com o código aberto (os
produtores disponibilizam estrutura e códigos de programação). E as grandes
marcas tecnológicas têm algo do género, pois conseguem lidar com o Português,
mas não disponibilizam esses modelos livremente.
O ChatGPT – assistente virtual inteligente no formato chatbot online com
IA, desenvolvido pela OpenAI, especializado em diálogo, lançado em novembro de
2022 – é o caso mais famoso do que é
possível fazer com os grandes modelos de processamento de linguagem (GPT), que
usam a IA para gerar textos a partir de grandes repositórios de dados. A
Albertina chega com a expectativa de abrir caminho a ferramentas similares ao
ChatGPT, criado a partir dos GPT produzidos pela OpenAI (GPT 3.5, ou mais
recentemente GPT 4). E funciona como recurso tecnológico que serve de base ao
desenvolvimento de várias ferramentas, que produzem conteúdos úteis para o
comum dos utilizadores, como sumários, traduções, classificação de texto
consoante as emoções, diálogos com pessoas (e assistentes digitais), legendagem
automática, entre outras coisas.
Os 33 downloads efetuados levam a crer que, para efeitos académicos e
comerciais, a Albertina já começou a ser explorada para o desenvolvimento de
novos produtos e tecnologias. E António Branco, depois de referir que já
existia, na variante brasileira, um protótipo bem “mais pequeno”, sendo a
Albertina o primeiro GPT em Português europeu, considera este lançamento um
marco histórico com significado comparável ao da primeira gramática para o Português,
pelo que é um reforço da soberania linguística.
O projeto foi desenvolvido no âmbito do consórcio Accelerate.AI, que
recebeu 35 milhões de euros para o desenvolvimento de diferentes projetos, ao
abrigo do Programa de Recuperação e Resiliência (PRR). Na IAG, o Accelerate.AI
prevê o desenvolvimento de um codificador e de um descodificador. O codificador
é a Albertina. O descodificador é o já mencionado GPT-PT, que sairá em julho
pelas mãos dos investigadores da FCUL. Ambos podem fazer o mesmo, mas, enquanto
a Albertina requer treinos mais intensivos e especializados em diferentes
temáticas, o GPT-PT tem um treino básico que lhe permite adaptar-se mais
facilmente a qualquer temática para produzir textos de forma autónoma, com
margens de erro menores. A Albertina exige mais treino, por estar assente numa
rede neuronal de menor dimensão; e o GPT-PT, por ter rede neuronal maior e mais
complexa, aprende mais rapidamente a produzir dados.
Há um traço em comum entre codificador e descodificador: a produção de
resultados sem os humanos terem de inserir regras de processamento de dados e
produção de conteúdos. A Albertina está assente numa rede neuronal artificial
que funciona da mesma forma como os neurónios se interligam. Dentro de um
cérebro, essas interligações são feitas por sinapses, mas num GPT são
conhecidas por parâmetros ou valores estatísticos que definem como um GPT
interpretará o mundo ou, pelo menos, as abordagens que seguirá para o
processamento da informação.
Em codificadores como a Albertina, o treino pode ser feito ao longo do
tempo e varia consoante a temática. Num descodificador como o GPT-PT o treino
resume-se à fase de preparação – e não há que voltar ao treino na fase de
operacionalidade. Em ambos casos, o conceito tem por ponto de partida a
introdução de textos processados a partir da identificação de padrões
estatísticos que ajudam a compreender os significados, a sintaxe, contextos ou
episódios históricos. E, com base nesta capacidade, os GPT produzem textos
adivinhando, através das probabilidades estatísticas, as palavras que faltam
para compor uma frase ou um texto inteiro sobre tema à escolha.
A livre distribuição destas ferramentas pode ser aproveitada por cibercrime
ou brincadeiras de mau gosto, mas o projeto segue as melhores práticas: este
processo de distribuição gratuita já foi feito para Inglês, para Espanhol ou
para Francês.
António Branco recorda que os codificadores de Língua Inglesa têm um número
de parâmetros similar aos 900 milhões da Albertina, mas admite que, nos
descodificadores, em que se há de enquadrar o futuro GPT-PT, o número de
parâmetros é maior, como sucedeu com o GPT 3.5 (175 mil milhões), que está na
origem dos primeiros casos de sucesso do ChatGPT, da OpenAI.
“Já foi lançado o GPT 4 pela OpenAI, mas nunca foi publicado um artigo a
explicar como funciona e ninguém conhece as caraterísticas técnicas”, recorda
António Branco, reforçando a defesa da soberania linguística, face aos projetos
das grandes marcas de tecnologias.
A Albertina foi treinada com textos redigidos em Português europeu e
brasileiro. Em qualquer dos casos, a eficiência na busca e no processamento de
informação depende da quantidade de dados disponíveis. “Admito que não vamos
conseguir levar o GPT-PT a ter a mesma dimensão dos GPT da OpenAI. E não é por
uma questão técnica ou de falta de recursos, mas sim por não haver, na Internet,
tantos textos disponíveis em Português, como há atualmente para Inglês”,
conclui o investigador da FCUL. Em julho se verá o que traz o GPT-PT.
***
O cofundador
da Microsoft, Bill Gates, antevê o surgimento num futuro próximo de uma aplicação
de IA que mudará completamente o comportamento do utilizador e erradicará
ferramentas atualmente populares, como motores de busca ou lojas ‘online’. Este
assistente de IA, que ainda não foi desenvolvido, entenderá as necessidades e
hábitos de uma pessoa e acabará com o uso da Internet como a conhecemos.
Na luta pela
liderança para criar a melhor ferramenta generativa baseada em IA, estão
gigantes da tecnologia como a Google, com o Bard, a Microsoft, com o Bing, e
‘startups’ como OpenAI, com ChatGPT. “Nunca mais iremos a um site de pesquisa, nunca mais iremos a um
site de produtividade ou à Amazon”,
destacou Bill Gates num evento da Goldman Sachs e SV Angel, em São Francisco,
sobre a IA. Por isso, “o mais importante é quem ganha um agente pessoal”, acrescentou.
Sobre que empresa criará tal assistente, Bill Gates realçou que ficaria desapontado,
se a Microsoft não “interviesse”. Porém, afirmou-se impressionado com algumas
‘startups’, como a Inflection.AI, cofundada pelo ex-executivo da DeepMind
Mustafá Suleyman.
***
A IA é a capacidade da máquina para
reproduzir competências semelhantes às humanas como o raciocínio, a
aprendizagem, o planeamento e a criatividade. Leva a que os sistemas
técnicos percebam o ambiente que os rodeia, lidem com o que percebem e resolvam
problemas, agindo para um objetivo específico. O computador recebe dados (preparados
ou recolhidos pelos seus sensores, por exemplo, uma câmara), processa-os e
responde. Os sistemas de IA adaptam o seu comportamento, através da análise dos
efeitos das ações anteriores e de um trabalho autónomo.
Tecnologias de IA existem há mais de
50 anos, mas o melhor desenvolvimento da capacidade de processamento, a
disponibilidade de quantidades elevadas de dados e novos algoritmos permitiram
grandes progressos da IA nos últimos anos.
A IA é considerada primordial para a
transformação digital da sociedade e tornou-se uma prioridade da União Europeia
(UE). Estão previstas futuras aplicações que trarão mudanças enormes, mas a IA
já está bem presente no nosso quotidiano. Vejamos:
Nas compras e na publicidade online,
a IA fornece recomendações personalizadas às pessoas, com base, por exemplo,
nas suas pesquisas e compras anteriores ou noutro comportamento online, bem como
otimiza os produtos, faz planeamento e inventários, organiza a logística, etc.
Os
motores de busca aprendem com a vasta entrada de dados, providenciados pelos
seus usuários, para fornecer resultados de pesquisa relevantes. Os smartphones
usam IA para fornecer um produto o mais relevante e personalizado possível. Os
assistentes virtuais que respondem a perguntas, fornecem recomendações e ajudam
a organizar rotinas tornam-se omnipresentes.
O
software de tradução linguística, baseado em texto escrito ou falado, confia na
IA, para fornecer e melhorar traduções, bem como para proceder à legendagem
automática.
Termóstatos
inteligentes aprendem com o nosso comportamento para economizar energia,
enquanto os desenvolvedores de cidades inteligentes controlam o tráfego para
melhorar a conectividade e reduzir os engarrafamentos. Enquanto os veículos
autónomos não são realidade, os carros usam funções de segurança alimentadas por
IA. A UE ajudou a financiar o VI-DAS, projeto relativo a sensores automatizados
que detetam situações perigosas e acidentes. A navegação é, em grande parte,
alimentada por IA. Os sistemas de IA reconhecem e combatem os ataques
cibernéticos e outras ameaças cibernéticas com base na introdução de dados, no
reconhecimento de padrões e no retrocesso dos ataques.
Na
covid, a IA é usada no controlo térmico em aeroportos e em outros lugares.
Na medicina, a IA ajuda a reconhecer a infeção através das radiografias
computadorizadas da tomografia dos pulmões e é usada para fornecer dados para
localizar a propagação dos vírus. Os investigadores pesquisam como podem usar
IA para analisar grandes quantidades de dados de saúde e para encontrar padrões
que levem a novas descobertas em medicina e a outras formas de melhorar o
diagnóstico individual. Por exemplo, desenvolveram um programa de IA para
atender chamadas de emergência e que reconhece uma paragem cardíaca, durante a
chamada, de modo mais rápido e com maior frequência, em comparação com o envio
de equipa médica. E o Kconect, projeto cofinanciado pela UE, desenvolve
serviços de pesquisa e texto multilingues para auxiliar as pessoas a encontrar
as informações médicas disponíveis e mais relevantes. Só importa acautelar, na
saúde, a privacidade das pessoas e o sigilo médico, como recomenda a Organização
Mundial da Saúde (OMS).
Certas
aplicações de IA detetam notícias falsas e desinformação, através do
controlo das informações nas redes sociais, da procura de palavras
sensacionalistas ou alarmantes e da identificação das fontes fidedignas.
A IA
melhora a segurança, a velocidade e a eficiência do tráfego ferroviário, ao
minimizar o atrito das rodas, maximizar a velocidade e possibilitar uma condução
autónoma, tal como ajuda os fabricantes a tornarem-se mais eficientes e a
trazer as fábricas de volta à Europa, através da utilização de robôs na
fabricação, da otimização dos caminhos de vendas ou da previsão em tempo real
da manutenção e falhas em fábricas inteligentes.
O Satisfactory é um projeto de investigação
cofinanciado pela UE, que usa sistemas de realidade aumentada e colaborativos
para acrescer a satisfação no trabalho em fábricas inteligentes.
A IA, na criação
de sistemas alimentares sustentáveis, garante alimentos saudáveis, minimizando
a utilização de fertilizantes, de pesticidas e de irrigação, e contribui para a
produtividade e para a redução do impacto ambiental. Os robôs removem ervas
daninhas. Por isso, muitas explorações agrícolas na UE já utilizam a IA para
monitorizar o movimento, a temperatura e o consumo de alimentos pelos animais.
Usando
uma vasta gama de dados e de reconhecimento de padrões, a IA alerta
antecipadamente para as catástrofes naturais e permite a preparação e atenuação
eficientes das consequências.
E a IA é
largamente usada na administração pública (fisco, segurança social, educação,
defesa, administração interna, etc.), incluindo a administração da Justiça (otimizando
a investigação e a análise, mas sem dispensar a inteligência e a mão humana humanas).
***
Se o governo
e o Parlamento usassem mais a IA, não haveria tantos “casos e casinhos”.
2023.05.24 –
Louro de Carvalho
Sem comentários:
Enviar um comentário