Large Language Models (LLMs) - Personal Knowledge Lab

# Apresentação "**Large Language Model (LLM)** é um tipo especializado de inteligência artificial (IA) treinado em grandes quantidades de texto para compreender o conteúdo existente e gerar conteúdo original." Large Language Models (LLMs) Gartner [Link](https://www.gartner.com/en/information-technology/glossary/large-language-models-llm) --- **O que são Large Language Model (LLM)?** Um **Large Language Model (LLM)** é um tipo de algoritmo de inteligência artificial ( IA ) que usa técnicas de aprendizagem profunda e conjuntos de dados extremamente grandes para compreender, resumir, gerar e prever novos conteúdos. O termo IA generativa também está intimamente ligado aos LLMs, que são, na verdade, um tipo de IA generativa que foi especificamente arquitetada para ajudar a gerar conteúdo baseado em texto. Um LLM é a evolução do conceito de modelo de linguagem em IA que expande drasticamente os dados usados para treinamento e inferência. Por sua vez, proporciona um aumento maciço nas capacidades do modelo de IA. Embora não exista um número universalmente aceito sobre o tamanho que o conjunto de dados para treinamento precisa ter, um LLM normalmente tem pelo menos um bilhão ou mais de parâmetros. Parâmetros é um termo de aprendizado de máquina para as variáveis presentes no modelo no qual foi treinado e que podem ser utilizadas para inferir novos conteúdos. **Para que são usados os grandes modelos de linguagem?** Os LLMs tornaram-se cada vez mais populares porque têm ampla aplicabilidade para uma variedade de tarefas de PNL, incluindo as seguintes: - **Geração de texto.** A capacidade de gerar texto sobre qualquer tópico no qual o LLM tenha sido treinado é um caso de uso principal. - **Tradução.** Para LLMs treinados em vários idiomas, a capacidade de traduzir de um idioma para outro é uma característica comum. - **Resumo do conteúdo.** Resumir blocos ou múltiplas páginas de texto é uma função útil dos LLMs. - **Reescrevendo conteúdo.** Reescrever uma seção de texto é outra capacidade. - **Classificação e categorização.** Um LLM é capaz de classificar e categorizar conteúdo. - **Análise de sentimentos.** A maioria dos LLMs pode ser usada para análise de sentimento para ajudar os usuários a compreender melhor a intenção de um conteúdo ou de uma resposta específica. - **IA conversacional e chatbots.** Os LLMs podem permitir uma conversa com um usuário de uma forma que normalmente é mais natural do que as gerações anteriores de tecnologias de IA. O que são Large Language Model (LLM)? TechTarget [Link](https://www.techtarget.com/whatis/definition/large-language-model-LLM) > [!NOTE] ChatGPT O chatbot de IA baseado em LLM mais usado é o [[ChatGPT]], desenvolvido pela OpenAI. # Referências Importantes How Large Language Models work From zero to ChatGPT Andreas Stöffelbauer Microsoft [Link](https://medium.com/data-science-at-microsoft/how-large-language-models-work-91c362f5b78f) # Trilha [[Inteligência Artificial]] [[ChatGPT]]