Como extrair texto de um PDF no macOS Sierra

Índice

Um dos formatos atuais mais utilizados para a transferência de informação é o PDF (Portable Document Format - Portable Document Format) que foi desenvolvido pela Adobe e nos oferece inúmeras vantagens, tais como:

  • Maior segurança de documentos
  • Redução do tamanho original
  • Compatibilidade com vários dispositivos
  • Preserva a integridade dos dados armazenados, entre outros.

A questão é que, em determinados momentos e por vários motivos, devemos extrair exclusivamente o conteúdo do texto do arquivo PDF, sem incluir outros elementos, como imagens ou assinaturas.

O Solvetic analisará como realizar esse processo facilmente no macOS Sierra sem recorrer a ferramentas extras.

Passo 1
Abrindo o documento: a primeira etapa a ser executada é abrir o documento PDF armazenado localmente no macOS Sierra, o que será feito automaticamente com o utilitário Preview:

É importante esclarecer que se usarmos ferramentas diferentes como o Adobe Reader, o arquivo PDF será aberto com essa ferramenta.

Passo 2
Seleção de texto: Agora vamos copiar as informações do arquivo PDF, o que normalmente fazemos com o mouse, mas se tivermos vários arquivos PDF, isso será uma tarefa demorada.

Podemos usar um dos seguintes métodos para tornar esse processo muito mais eficiente:

  • Vá para o menu Editar e selecione a opção Selecionar tudo
  • Use a combinação de teclas ⌘ + A
.

Assim que selecionarmos esta opção, veremos o texto selecionado:

etapa 3
Copie e cole o conteúdo: Uma vez que o texto no arquivo PDF tenha sido selecionado, procedemos para copiá-lo usando uma das seguintes opções.

Copiar texto em PDF

  • Vá para o menu Editar e selecione Copiar
  • Use a combinação de teclas ⌘ + C

Assim que tivermos essas informações na área de transferência, abriremos o aplicativo TextEdit usando qualquer uma das seguintes opções

  • Insira a palavra texto no Spotlight e selecione TextEdit
  • Vá para o caminho go / Applications e selecione TextEdit

A seguinte janela será exibida. Lá selecionamos o botão Novo documento.

Passo 4
Na nova janela vamos ao menu Formatar e lá selecionamos a opção Converter para texto simples ou podemos usar a combinação de teclas ⇧ + ⌘ + T. O resultado será o seguinte:

Com este método simples, podemos extrair facilmente o texto dos arquivos PDF necessários.

wave wave wave wave wave