Como treinar uma inteligência artificial?

É necessário treinar uma inteligência artificial antes de colocar qualquer ferramenta que use essa tecnologia em prática. O processo de aprendizagem da IA requer bases de dados, uma série de testes, diferentes tipos de supervisão e um esquema de feedback para resultados.

O treinamento pode usar diversos conceitos de aprendizado de máquina (machine learning ou ML) e deep learning. O conceito é aplicado a todos os formatos de inteligência artificial, desde aplicativos simples até ferramentas mais poderosas de IA generativa (capazes de gerar textos ou imagens), como ChatGPT e Bard.

Como uma IA é treinada

Primeiramente, é necessário reforçar que o treinamento e a quantidade de dados usada varia conforme cada tipo de IA. Sistemas mais complexos vão exigir uma base de dados maior para interpretação, mas existem situações de ferramentas simples que não exigem um treinamento tão amplo.

No caso de ChatGPT, Bard e concorrentes, a estrutura é baseada em um grande modelo de linguagem (Large Language Model ou LLM). Cada algoritmo é treinado com uma base de dados imensa, abastecida por páginas da web, livros, artigos científicos e imagens, entre outros conteúdos.

A equipe responsável pelo projeto fornece toda essa quantidade de informação para que as redes neurais do algoritmo identifiquem os dados e consigam associar qual é a melhor sequência de palavras possível para um comando. O GPT-3, da OpenAI, foi treinado com aproximadamente 500 bilhões de palavras até o lançamento em 2020. O LaMDA, modelo de linguagem do Google, foi treinado com 1,56 trilhão de palavras.

IAs como o Bard são treinadas a partir de quantidades massivas de dados (Imagem: Mojahid Mottakin/Unsplash)
IAs como o Bard são treinadas a partir de quantidades massivas de dados (Imagem: Mojahid Mottakin/Unsplash)

Todo esse conhecimento é combinado com um sistema de Processamento de Linguagem Natural, que permite compreender a linguagem humana e desenvolver respostas. Dessa forma, a partir de um comando feito por humano, a IA usa aprendizado de máquina para gerar uma resposta a partir dos parâmetros adquiridos com a rede neural.

Vale a pena lembrar que isso tem muitas limitações de hardware: para conseguir processar essa quantidade de conteúdo, as empresas de tecnologia desenvolvem supercomputadores.

Além disso, os resultados são mais precisos quando há uma amostragem maior de conhecimento para análise. Por exemplo: ao pedir para uma IA diferenciar fotos de gatos e cachorros, ela pode usar alguns quesitos primários, como a cor dos pelos. Ao inserir mais fotos dos animais com cores diferentes, o sistema é capaz de identificar outros padrões que diferem as espécies, como o formato do corpo.

Feedback

As equipes de IA criam um sistema de feedback para refinar as respostas, conhecido como aprendizado reforçado. Caso a resposta seja incorreta, o sistema recebe uma marcação negativa e procura formas de corrigir. Em respostas corretas, recebe uma marcação positiva, que funciona como uma “recompensa”.

Após esses ajustes pontuais, as próprias redes neurais já conseguem corrigir as incoerências. De qualquer forma, o próprio usuário de um chatbot por IA consegue apontar um feedback quando recebe uma resposta imprecisa.

Qualquer usuário pode gerar feedback às respostas do ChatGPT, por exemplo (Imagem: Captura de tela/André Magalhães/Canaltech)
Qualquer usuário pode gerar feedback às respostas do ChatGPT, por exemplo (Imagem: Captura de tela/André Magalhães/Canaltech)

Alucinações de IA

No segmento da inteligência artificial generativa, a alucinação ocorre quando o sistema começa a criar informações imprecisas ou sem sentido. Isso é um grande problema: o ChatGPT já criou uma acusação de assédio sexual contra um professor e gerou textos sobre casos jurídicos que nunca aconteceram, por exemplo.

As ferramentas recebem filtros de otimização para evitar as alucinações, mas o caminho para eliminar esse fenômeno ainda é longo.

Quer testar o treinamento de uma IA? Veja alguns comandos para usar no Bard e também no ChatGPT.

*Com informações de Canal Tech

Related post

Leave a Reply

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *