Como digitalizar e extrair texto de imagens do Windows 10

Em muitas ocasiões é possível que tenhamos encontrado arquivos em que aparecem imagens, mas que estejamos realmente apenas interessados ​​no texto que elas contêm, já que podemos até querer alterar a extensão.

Uma das tecnologias actuais muito práticas e interessantes para qualquer tipo de utilizador é a tecnologia OCR (Optical Character Recognition) que nos dá a possibilidade de extrair o texto de uma imagem de uma forma simples e que nos permite ter uma ferramenta prática em lado a lado já que muitas vezes devemos ter o texto editável de uma imagem, seja um pdf da universidade, um extrato bancário, uma imagem com instruções de uso, enfim, várias opções.

Basicamente, o OCR nos permite converter vários tipos de arquivos em um formato editável e ter a opção de pesquisa dentro dele.

A operação básica da tecnologia OCR

  • O OCR primeiro analisa a estrutura da imagem.
  • Mais tarde, ele divide o texto em elementos como imagens, texto, etc.
  • Divida as linhas em palavras e depois em caracteres
  • Isso é salvo em formato de texto

Hoje vamos analisar como implementar e usar a tecnologia OCR no Windows 10, mesmo se os programas predefinidos para visualizar imagens, como Fotos ou Paint, não tenham essa capacidade.

1. Conheça e baixe o Photo Scan

Passo 1
Photo Scan é uma ferramenta gratuita que nos dará a possibilidade de extrair texto de imagem ou arquivo como PDF simples e completamente. O Photo Scan é sem dúvida uma ferramenta que nos ajudará muito em todo o trabalho que requeira a obtenção da informação de qualquer ficheiro de imagem, dando-nos um conteúdo exacto e fiável do texto do ficheiro.

Principais Características Digitalização de Fotos

  • Suporta dispositivos como câmera
  • Suporta vários idiomas
  • A extração de texto é fácil
  • Podemos configurá-lo com diferentes temas para obter uma melhor visualização
  • Suporta texto para fala
  • Gratuito
  • Suporta Windows 10 Anniversary Edition
  • Podemos colar imagens diretamente da Internet

O link a seguir nos levará diretamente para a loja do Windows e de lá podemos fazer o download e instalá-lo com segurança.

digitalização de fotos

Passo 2
Quando instalamos e executamos o Photo Scan pela primeira vez, teremos o seguinte ambiente. Como podemos ver, temos três (3) alternativas para obter as imagens das quais iremos extrair o texto:

  • Navegar na foto: Usando esta opção, podemos pesquisar as imagens dentro de nossa equipe
  • Use a câmera: Com esta opção podemos usar a câmera do Windows 10 para capturar a imagem
  • Colar imagem: Com esta alternativa podemos colar imagens diretamente da internet

etapa 3
Para entender o grande alcance do Photo Scan definimos a forma como obteremos a imagem, neste caso será Browse Photo¸ e podemos ver o trabalho do Photo Scan em andamento:

Como podemos ver, o aplicativo extrai completamente o texto da imagem que selecionamos.

2. Configurações de imagem

Assim que tivermos nossa imagem com o texto extraído, podemos usar alternativas como:

Ouça o textoEsta é uma das principais funcionalidades da aplicação, pois ao premir o ícone do volume localizado na parte superior ouviremos todo o texto da imagem.

GuardaAo clicar no ícone do disquete para salvar nosso texto, devemos selecionar a localização e o nome do arquivo onde o formato padrão será Documento de Texto para permitir a edição posterior.

Quebra de textoPodemos clicar no ícone, podemos definir a orientação do texto extraído, por padrão é vertical, mas podemos convertê-lo para horizontal.

Configurações adicionaisPodemos clicar no botão com três linhas horizontais localizado no canto superior esquerdo e veremos que o seguinte é exibido:

Na parte inferior, clicamos na opção Configurações + Sobre para acessar outros parâmetros do aplicativo

Lá podemos definir valores como:

  • O idioma em que o texto será extraído
  • Escolha um tema personalizado para o aplicativo
  • Definir opções de texto padrão

O Photo Scan será uma ferramenta valiosa para aqueles momentos em que é necessário ter o texto de uma imagem ou arquivo em mãos para edição.

Extrair imagem de PDF

wave wave wave wave wave