Python - Arquivos Remotos

Índice

Pitão nos permite trabalhar com arquivos remotos, talvez isso não pareça lógico dessa forma, mas arquivos remotos, neste caso, nada mais são do que consultas a páginas da Web de nosso programa Python, a razão para fazer isso pode ser uma consulta a Serviços da Web REST que nos permitem obter valores por OBTER ou consultar páginas diretamente e manipular seu conteúdo.

Para conseguir isso, usaremos algumas das muitas bibliotecas que oferece Pitão para trabalhar com redes, removendo assim os obstáculos técnicos e concentrando-nos apenas na sua importância na nossa lógica de programação.

urllib e urllib2
Essas duas livrarias urllib Y urllib2 Eles nos permitem fazer o trabalho de acessar arquivos através da rede como se estivessem em nosso ambiente local, através de uma simples chamada a uma função, isso pode nos servir para muitas coisas, por exemplo, podemos usar uma Web e com seu conteúdo fazer relatórios em nosso programa do que podemos encontrar nele.

Essas duas bibliotecas são semelhantes, a diferença é que urllib2 pode ser um pouco mais sofisticado, onde se quisermos simplesmente fazer uma consulta sem outras implicações, podemos usar urllib, mas se quisermos fazer algum processo de autenticação ou usar cookies, então urllib2 pode ser a escolha certa para nosso programa.

Já que teoricamente sabemos o que precisamos e por que precisamos, vamos ver um pequeno exemplo de código para que fique claro para nós o que podemos fazer, no exemplo a seguir vamos abrir uma Web a partir de nosso programa e, em seguida, por meio de expressões regulares vamos extrair um link de seu conteúdo para isso usaremos urllib:

 >>> from urllib import urlopen >>> webpage = urlopen ('http://www.python.org') >>> import re >>> text = webpage.read () >>> m = re.search ( 'Tutorial', texto, re.IGNORECASE) >>> m.group (1) 

Vamos passo a passo, primeiro a partir da biblioteca urllib que importamos urlopen, então criamos uma variável chamada página da Internet que é aquele que conterá o resultado de urlopen O que faremos no site oficial de Pitão, com isso já importamos Para trabalhar com expressões regulares, dizemos que o texto é a variável que terá o conteúdo da leitura da página, fazemos uma pesquisa com uma expressão regular e finalmente agrupamos o resultado, que deve imprimir o seguinte:

http://docs.python.org/

Isso é graças ao método urlopenO que você faz é que nos permite trabalhar com a página da Web como se fosse um objeto de arquivo, desta forma podemos aplicar muitas das funções que podemos usar com este tipo de objetos, mesmo se quisermos podemos baixar a página e trabalhe em nosso local de uma maneira muito fácil usando o método urlretrieve da seguinte forma:

 urlretrieve ('http://www.python.org', 'C: \ python_webpage.html')
A única coisa que fazemos é passar como segundo parâmetro o caminho em nosso ambiente local onde o arquivo com a cópia da página deve ser salvo sem muita dificuldade.

Com isso terminamos este tutorial, pois vemos que fazer um trabalho mais complexo como usar páginas em nossos programas é bastante simples graças às bibliotecas de Pitão.

Gostou e ajudou este tutorial?Você pode recompensar o autor pressionando este botão para dar a ele um ponto positivo
wave wave wave wave wave