Introdução à programação estatística com R

Índice
R é uma linguagem de programação estatística, é gratuita e de código aberto. É usado principalmente para as operações de mineração de dados ou estatísticas, tudo isso com o objetivo de criar aplicações para a análise de grandes quantidades de dados.
A interface de linha de comando de R No início pode ser um pouco intimidante, mas isso é ofuscado depois de avaliar o poder e as possibilidades que a linguagem nos oferece para compartilhar e reproduzir a análise de informações.
R Pode ser baixado gratuitamente para todas as plataformas gratuitas que existem hoje, temos a possibilidade de instalá-lo em janelas, Linux e até mesmo Mac.
Para os fins deste tutorial, usaremos a versão para janelas que podemos encontrar na página oficial do projeto no link a seguir. Depois de baixar e instalar, teremos nossa cópia funcional do R, se o executarmos teremos a tela inicial de R que deve ser parecido com este:

R Permite-nos trabalhar com dados de forma rápida e eficaz, mas a sua interface predefinida não é perfeita para esta tarefa. Um dos problemas é que tudo abre em janelas separadas dificultando o trabalho e também a interface de linha de comando não é a mesma em todos os sistemas operacionais.
Embora existam muitas interfaces para resolver este problema, neste tutorial usaremos RStudio que está disponível para todas as plataformas, mas é importante mencionar que é necessário ter R instalado antes da instalação, para obter a versão do janelas vamos ao seguinte link e baixamos a versão correspondente.
Após a instalação, executamos RStudio e devemos ver a interface principal:

RStudio nos dá a organização de todas as janelas de R dentro de um único painel e adicionalmente nos dá acesso a funções que podem ser difíceis de encontrar, além disso, podemos citar outras vantagens adicionais:
  • Vamos dividir nosso trabalho em Projetos onde cada um deles terá seu diretório de trabalho, histórico e arquivos de origem.
  • Integração com GitHub.
  • Permite que você armazene uma história graficamente.
  • Você pode exportar os gráficos em diferentes formatos e tamanhos.
  • Ele nos permite completar o código com a chave tabular.
  • Você pode criar gráficos interativos graças a certos pacotes.
Como vemos RStudio é uma maneira bastante ideal de trabalhar com RPorém, existem outras soluções no mercado, cabe a cada um investigá-las e avaliar se estão mais bem adaptadas às necessidades de cada um.
Existem várias maneiras de trabalhar com R onde a primeira coisa que abordaremos é a Console RApesar de não podermos armazenar o trabalho realizado aqui, é bastante útil testar algumas funções e começar a se familiarizar com a linguagem.
Trabalhar com o console é bastante simples, nós inserimos um comando e então R nos dá a saída dele, vamos tentar uma operação de adição simples como a seguinte:
> 10 + 7

Nós empurramos Digitar e automaticamente R Na linha seguinte, dá-nos a resposta à nossa operação:

Como podemos ver na imagem a primeira linha contém o comando com a nossa operação, é importante mencionar que R não requer o uso de ponto-e-vírgula para encerrar a linha ou qualquer outro operador de terminação. Podemos ver na segunda linha antes da resposta a [1] isso indica a maneira pela qual R executa operações aritméticas e está usando vetor, significa o índice do primeiro elemento do vetor, onde podemos destacar que muitas outras linguagens tratam os índices do zero, mas R faz isso de um.
Como mencionamos anteriormente, o console é bastante útil, mas não é o melhor para trabalhar, principalmente porque não tem a possibilidade de armazenar nossos comandos e a capacidade de inserir apenas um comando por vez, algo semelhante acontece com Pitão, mas não devemos nos preocupar, pois RStudio nos dá o janela de script localizado na parte superior do nosso console, se não o encontrarmos, vamos para Arquivo> Novo arquivo> R Script ou pressione Shift + Command + N.
Basicamente, um script R é um texto simples com a extensão .R. Para ver como funciona, podemos recriar nossa operação aritmética do exemplo anterior, criando um novo script e adicionando várias linhas de comando adicionais, vejamos:
 10 + 7 impressão 1:50 ("Olá, mundo") 

UMA Roteiro R você pode executar linha por linha com a opção que temos no menu superior chamada Corre e veremos a saída do mesmo no console, vamos ver a resposta para cada linha do nosso script:

Como podemos ver a primeira linha nos dá o resultado que obtivemos anteriormente, a segunda linha cria uma lista de números de 1 a 50 onde o número entre parênteses é o primeiro índice dessa linha e finalmente temos a impressão do clássico Olá mundo.
Depois de ver as maneiras como podemos trabalhar com a linguagem, passaremos a conceitos mais teóricos para entender melhor o que temos disponível na linguagem para trabalhar e executar nossos projetos.
Como em todas as linguagens de programação, variáveis são um dos aspectos mais importantes, para criá-los em R Precisamos apenas escrever o nome dele, sem definir o tipo. Nós usamos o operador de atribuição para dar o valor à variável.
ImportantePodemos atribuir o valor de uma variável com o sinal de igual, mas isso é uma má prática em R, para fazer a atribuição correta, use o operador <-.
Vamos ver como atribuir um valor a uma variável e, em seguida, imprimi-lo se parece com:
 x <- 58 x 

Também podemos atribuir vários valores às nossas variáveis ​​com a função concatenar:
y <- c (5, 2, 11, 28, 17)

Se executarmos o exemplo, veremos no painel direito como temos o valor de x e a lista numérica atribuída a Y:

PROLONGAR

Além disso, para eliminar uma variável do espaço de trabalho, basta usar a função rm, podemos até limpar todo o espaço de trabalho, vamos ver como fazemos isso:
 rm (x) rm (lista = ls ()) 

Com a primeira linha eliminamos a variável e com a segunda linha todo o espaço.
Na linguagem, temos quatro estruturas de dados, que são reconhecidas por R:
Vetor de desenho animadoUm vetor é um array unidimensional onde todos os dados presentes nele devem ser do mesmo tipo, inteiro, char, etc., além disso, é importante notar que este é o objeto de dados básico em R.
Matrizes e matrizesUma matriz é semelhante a um vetor onde os dados devem ser do mesmo tipo, porém a matriz possui duas dimensões e as informações são organizadas em linhas e colunas. A matriz é semelhante à matriz, mas pode ter mais de duas dimensões.
Quadros de dadosOs data frames são uma coleção de vetores de mesmo comprimento, é semelhante à matriz, mas a peculiaridade desse tipo de estrutura é que eles podem ser de tipos de dados mistos, onde os vetores podem até ter nomes.
ListasO tipo mais genérico de estrutura em R, uma lista é uma coleção de elementos de qualquer classe, comprimento ou estrutura, podemos até ter outras listas.
Mais distante, R Possui várias funções que nos permitem converter um tipo de estrutura em outro, vejamos:
as.vector ()Esta função permite converter matrizes em vetores unidimensionais.
as.matrix ()Você pode converter estruturas de dados em uma matriz.
as.data.frame ()Você pode converter estruturas de dados em quadros de dados.
as.list ()Você pode converter estruturas de dados em listas.
Um dos pontos fortes de R é que você pode adicionar pacotes que nos permitem estender as funcionalidades da linguagem. Em outras linguagens, esses plug-ins vêm em bibliotecas, mas em R, a biblioteca é o local onde todos os pacotes são armazenados.
O pacotes do R podem vir de dois lugares diferentes, alguns vêm com R por padrão, mas eles não estão ativos e outros podem ser encontrados em repositórios online.
Para ver os pacotes atualmente instalados ou carregados, podemos executar as seguintes funções:
 biblioteca () pesquisa () 

A função biblioteca () nos traz uma lista dos pacotes que estão instalados atualmente, vamos ver uma parte do que ela joga sobre nós quando executamos esta linha:

A função procurar () Por outro lado, mostra-nos por console os pacotes que estão carregados atualmente, vamos ver na imagem a seguir quais pacotes carregamos:

Além disso, para instalar pacotes podemos fazê-lo de várias maneiras, a primeira é através da opção no menu superior Ferramentas> Instalar Pacotes e depois temos através das funções da linguagem, esta última é a que recomendamos, pois pode assim fazer parte do nosso script.
Para instalar um pacote que usamos install.packages, depois disso, devemos incluí-lo, podemos usar biblioteca ou exigir Para isso, no entanto, é melhor usar o último para evitar confusão com o escopo das funções, vamos ver como instalamos e incluímos o pacote ggplot2:
 install.packages ("ggplot2") require ("ggplot2") 

Finalmente, para excluir um pacote, podemos usar remove.packages, vamos ver como ele é usado:
remove.packages ("ggplot2")

Com isso encerramos este tutorial, com o qual já temos uma noção de como trabalhar com R, além de termos pontos esclarecidos como variáveis ​​e estruturas de dados, aspectos essenciais que devemos conhecer para aproveitar ao máximo esta linguagem poderosa e eficaz.Gostou e ajudou este tutorial?Você pode recompensar o autor pressionando este botão para dar a ele um ponto positivo

Você vai ajudar o desenvolvimento do site, compartilhando a página com seus amigos

wave wave wave wave wave