Em muitas ocasiões é possível que tenhamos encontrado arquivos em que aparecem imagens, mas que estejamos realmente apenas interessados no texto que elas contêm, já que podemos até querer alterar a extensão.
Uma das tecnologias actuais muito práticas e interessantes para qualquer tipo de utilizador é a tecnologia OCR (Optical Character Recognition) que nos dá a possibilidade de extrair o texto de uma imagem de uma forma simples e que nos permite ter uma ferramenta prática em lado a lado já que muitas vezes devemos ter o texto editável de uma imagem, seja um pdf da universidade, um extrato bancário, uma imagem com instruções de uso, enfim, várias opções.
Basicamente, o OCR nos permite converter vários tipos de arquivos em um formato editável e ter a opção de pesquisa dentro dele.
A operação básica da tecnologia OCR
- O OCR primeiro analisa a estrutura da imagem.
- Mais tarde, ele divide o texto em elementos como imagens, texto, etc.
- Divida as linhas em palavras e depois em caracteres
- Isso é salvo em formato de texto
Hoje vamos analisar como implementar e usar a tecnologia OCR no Windows 10, mesmo se os programas predefinidos para visualizar imagens, como Fotos ou Paint, não tenham essa capacidade.
1. Conheça e baixe o Photo Scan
Passo 1
Photo Scan é uma ferramenta gratuita que nos dará a possibilidade de extrair texto de imagem ou arquivo como PDF simples e completamente. O Photo Scan é sem dúvida uma ferramenta que nos ajudará muito em todo o trabalho que requeira a obtenção da informação de qualquer ficheiro de imagem, dando-nos um conteúdo exacto e fiável do texto do ficheiro.
Principais Características Digitalização de Fotos
- Suporta dispositivos como câmera
- Suporta vários idiomas
- A extração de texto é fácil
- Podemos configurá-lo com diferentes temas para obter uma melhor visualização
- Suporta texto para fala
- Gratuito
- Suporta Windows 10 Anniversary Edition
- Podemos colar imagens diretamente da Internet
O link a seguir nos levará diretamente para a loja do Windows e de lá podemos fazer o download e instalá-lo com segurança.
digitalização de fotos
Passo 2
Quando instalamos e executamos o Photo Scan pela primeira vez, teremos o seguinte ambiente. Como podemos ver, temos três (3) alternativas para obter as imagens das quais iremos extrair o texto:
- Navegar na foto: Usando esta opção, podemos pesquisar as imagens dentro de nossa equipe
- Use a câmera: Com esta opção podemos usar a câmera do Windows 10 para capturar a imagem
- Colar imagem: Com esta alternativa podemos colar imagens diretamente da internet
etapa 3
Para entender o grande alcance do Photo Scan definimos a forma como obteremos a imagem, neste caso será Browse Photo¸ e podemos ver o trabalho do Photo Scan em andamento:
Como podemos ver, o aplicativo extrai completamente o texto da imagem que selecionamos.
2. Configurações de imagem
Assim que tivermos nossa imagem com o texto extraído, podemos usar alternativas como:
Ouça o textoEsta é uma das principais funcionalidades da aplicação, pois ao premir o ícone do volume localizado na parte superior ouviremos todo o texto da imagem.
GuardaAo clicar no ícone do disquete para salvar nosso texto, devemos selecionar a localização e o nome do arquivo onde o formato padrão será Documento de Texto para permitir a edição posterior.
Quebra de textoPodemos clicar no ícone, podemos definir a orientação do texto extraído, por padrão é vertical, mas podemos convertê-lo para horizontal.
Configurações adicionaisPodemos clicar no botão com três linhas horizontais localizado no canto superior esquerdo e veremos que o seguinte é exibido:
Na parte inferior, clicamos na opção Configurações + Sobre para acessar outros parâmetros do aplicativo
Lá podemos definir valores como:
- O idioma em que o texto será extraído
- Escolha um tema personalizado para o aplicativo
- Definir opções de texto padrão
O Photo Scan será uma ferramenta valiosa para aqueles momentos em que é necessário ter o texto de uma imagem ou arquivo em mãos para edição.
Extrair imagem de PDF