O trabalho de transcrição de áudio para texto é extremamente cansativo. Mesmo que você consiga transcrever de forma eficiente, ainda é demorado. Que tal colocar uma Inteligência Artificial para trabalhar por você? E a melhor parte, tudo gratuito!
Transformar áudio em texto é uma tarefa que demanda muita atenção e tempo. Felizmente, essa atividade vem sendo gradativamente assumida por máquinas: No começo, programas automáticos, como o Closed Captions do YouTube, já possibilitavam uma transcrição limitada. Nos dias de hoje, a Inteligência Artificial avançada é capaz de assumir essa tarefa de forma mais eficiente e precisa.
Neste tutorial vamos ensinar como utilizar a Whisper AI, uma inteligência artificial criada pela Open AI, o mesmo grupo que desenvolveu o popular Chat GPT. Todos os arquivos de vídeo ou áudio enviados para ela serão automaticamente convertidos para texto em um clique, totalmente gratuito e sem programas. Uma ótima notícia para quem precisa transcrever áudio para texto diariamente.
O WhisperAI é extremamente poderoso e consegue transcrever até áudios de baixa qualidade, como audiências, aulas EAD, apresentações gravadas da platéia, etc.

📝 O que você vai precisar?

Tempo necessário: 15 minutos
Siga todos os passos com atenção e vamos aprender a transcrever áudio utilizando IA.
Acesse o Google Drive. Se você não tem uma conta Gmail, basta criar uma de graça.
No Google Drive, clique no botão “Novo” no canto superior esquerdo da tela;
 
Na parte de baixo clique em “Mais” e depois em “Conectar mais apps“;
Na aba de pesquisa, digite “Google Colaboratory”. Clique em “Instalar” e o aplicativo será instalado dentro do seu Google Drive;
Agora vamos no botão “Novo” mais uma vez, agora clique em “Mais“, e clique no “Google Colaboratory”, aplicativo que acabamos de instalar;
Pronto, chegamos no aplicativo Google Colab. Antes de qualquer coisa, temos de fazer uma pequena configuração para garantir que tudo funcione. Clique em Ambiente de execução, e depois em Alterar o tipo de ambiente de execução;
No “Tipo de ambiente de execução” certifique-se que esteja em Python 3. No “Acelerador de hardware“, selecione T4 GPU. Agora clique em Salvar;
Agora vamos instalar Whisper AI no Google Colab. Clique na barra de texto para digitar o texto do passo seguinte. Se não encontrar essa barra de texto, clique em + Código;
Copie e cole o seguinte código e depois clique no botão para instalar o Whisper AI:
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
A instalação demora aproximadamente 3 minutos. Agora, no lado esquerdo, clique no ícone de pasta para abrirmos os arquivos; 
Aqui dentro podemos clicar e arrastar todos os arquivos de áudio que desejamos transcrever. No caso, utilizarei o áudio da nosas análise de um celular da Samsung como exemplo. Arraste o(s) arquivo(s) de áudio;
Agora basta clicar em +Código e digitar na barra de texto o seguinte código para iniciar o processo de transcrição:
!whisper “nome do arquivo aqui.mp3” –model medium

Pressione o botão para iniciar, aguarde alguns minutos e pronto! O seu arquivo foi transcrito com sucesso. 
(No “nome do arquivo aqui”, não se esqueça de incluir o formato no nome, como .mp3, .FLAC, .WAV, etc). 
No lado direito, temos os tempos e a transcrição. No lado esquerdo, junto do arquivo de áudio que arrastamos anteriormente, temos os arquivos “.srt” e “.vtt“, que podem ser utilizados para legendar vídeos utilizando um player compatível como o VLC Media. Já o arquivo “.txt” é a transcrição completa e pode ser aberta no bloco de notas do Windows.
Restou alguma dúvida? Algum passo ficou confuso? Deixe um comentário abaixo que responderemos o mais rápido possível.
Se você enfrentou esse erro no passo 11, significa que o arquivo de áudio está corrompido OU você digitou o nome errado. Lembrando que, além do nome do arquivo, é necessário adicionar o formato do mesmo, como .mp3, WAV, FLAC…
Para descobrir o formato do arquivo, faça o seguinte:
1.Clique com o botão direito no arquivo e depois em Propriedades;
2. No caso do arquivo que utilizamos para testar aqui no tutorial, é um .mp3, ou seja, temos de colocar o “.mp3” no final do nome do arquivo, fica assim:
!whisper “Samsung Galaxy A34 Review_ O MELHOR ACERTO da Samsung em 2023.mp3” –model medium

😕 Poxa, o que podemos melhorar?
😃 Boa, seu feedback foi enviado!
✋ Você já nos enviou um feedback para este texto.
Luís Felipe Jähn é redator e roteirista do Oficina da Net. Formado em História, é apaixonado por computadores desde o Windows 98. Começou a trabalhar no Oficina da Net no começo de 2022, sendo responsável por análises de hardware, periféricos, Smart TVs, Notebooks e celulares. Contato: [email protected]
Procurando um novo smartphone no Brasil? Confira três modelos com excelentes preço e 256 GB de armazenamento para comprar agora.
Ter um celular com 256 GB de armazenamento é imprescindível na era tecnológica que vivemos, mas 512 GB é o ideal para te atender por muitos anos
Procurando um novo smartphone para comprar? Se liga nessa seleção de ofertas com três aparelhos com uma memória de 128 GB
Não é por que as empresas lançam novos celulares todos os anos que os modelos do ano passado não valem mais a pena. Veja essa lista!
Procurando um novo smartphone para comprar? Se liga nessa seleção de ofertas com três aparelhos com uma memória de 128 GB
Oficina da Net © 2005 – 2024 – Um site do grupo

source

Share This

Qual é a sua reação?
0Gostei0Muito Bom0Wow0Amei0Não Curti0Não Gostei

Deixe um comentário

Fique por dentro.
Assine nossa newsletter.

Receba dicas incríveis e PROMPTS de comandos úteis para facilitar seu dia a dia,
diretamente na sua caixa de entrada!

A maior comunidade Brasileira de Prompts para ChatGPT OpenAI e outras inteligências artificiais.

Copyright ©  ChatGPT Academy 2024. Todos os direitos reservados.

Copyright ©  ChatGPT Academy 2024. Todos os direitos reservados.