As bases de dados são um elemento fundamental no trabalho com grandes quantidades de dados graças ao seu dinamismo, hierarquia, parametrização e simplicidade de gestão.
Hoje temos a oportunidade de selecionar vários bancos de dados como MySQL, MariaDB, etc., e cada um tem suas vantagens e suas configurações com base no número de usuários e parâmetros para trabalhar, mas hoje vamos falar de um em particular chamado Cassandra la o que pode ser muito útil quando se trabalha com banco de dados e para isso usaremos o CentOS 7.
O que é cassandraCassandra é um banco de dados de código aberto projetado para escalabilidade e alta disponibilidade sem comprometer o desempenho geral do sistema.
O Cassandra possui fatores como escalabilidade linear e tolerância a falhas em hardware básico ou infraestrutura em nuvem que o tornam a plataforma perfeita para dados de missão crítica. O suporte do Cassandra para replicação em vários data centers é o melhor da categoria, garantindo menor latência para os usuários e melhorando os níveis gerais de desempenho.
Cassandra é um banco de dados que suporta replicação local e replicação de vários data centers para redundância, failover e recuperação de desastres.
Apresenta CassandraAlgumas de suas características são:
- Disponibilidade: A base de dados Cassandra é reconhecida por sua confiabilidade a ponto de ser utilizada por mais de 1000 empresas em todo o mundo, entre as quais podemos destacar Instagram, GitHub, Netflix, com as quais podemos utilizar o Cassandra com total confiança.
- Tolerância a falhas: Um ponto crítico em qualquer banco de dados é a disponibilidade das informações e neste aspecto o Cassandra possui uma ampla tolerância a falhas, na qual todos estamos expostos a sofrer, ao permitir que todos os dados nela armazenados tenham a capacidade de serem automaticamente replicado em outros nós, garantindo sua integridade e disponibilidade. Além disso, quando um nó apresenta algum tipo de erro, ele pode ser substituído sem a necessidade de desligar o banco de dados, o que afeta a operabilidade e a produtividade dos usuários.
- Performance: Um ponto a favor do Cassandra é a sua alta performance através da qual é possível ir a um patamar superior às plataformas NoSQL já conhecidas tanto no nível de gerenciamento quanto de aplicação.
- Descentralizado: Outra característica que se destaca no Cassandra é a sua administração descentralizada, pois cada nó envolvido no banco de dados é único, evitando assim falhas massivas.
- Escalável: Um ponto a se considerar em um banco de dados é sua capacidade de escalabilidade, pois permite que conforme a empresa cresce o banco de dados não se limite em sua ação, por isso o Cassandra é uma das melhores opções, pois, de acordo com suas estatísticas, possui o capacidade para suportar até mais de 2.000 nós, mais de 400 TB de dados e cerca de 1 bilhão, ou mais, de solicitações todos os dias, o que garante seu amplo alcance.
- Durável: Outro aspecto a ter em conta na escolha da base de dados a trabalhar é a sua capacidade de durabilidade, isto implica que a base de dados deve ter a capacidade de permitir que os dados críticos fiquem sempre disponíveis independentemente do tipo de falha. gerenciamento ideal e correto de cada dado armazenado.
- Opções de controle: Com o banco de dados Cassandra temos várias opções de administração como replicação síncrona ou assíncrona, no caso de usar a opção de gerenciamento assíncrono teremos um banco de dados que suporta funções adicionais como Hinted Handoff e Read Repair para expandir sua capacidade de usabilidade.
1. Atualize o sistema e instale o Java no CentOS 7
Passo 1
O primeiro passo é atualizar o sistema operacional, isso pode ser feito executando o seguinte comando:
sudo yum update -yPasso 2
O Cassandra é escrito em Java, portanto será necessário instalar o Java no CentOS 7 executando o seguinte comando:
sudo yum install java -y
etapa 3
Podemos verificar a versão do Java instalada executando o seguinte comando:
sudo java -version
2. Instale o Cassandra no CentOS 7
Passo 1
Por padrão, o banco de dados Cassandra não está disponível no repositório padrão do CentOS 7 por este motivo, será necessário adicionar os repositórios oficiais da Apache Software Foundation ao CentOS 7, e isso é feito criando o arquivo cassandra.repo dentro do diretório /etc/yum.repos.d da seguinte forma:
sudo nano /etc/yum.repos.d/cassandra.repoPasso 2
Neste novo arquivo criado, adicionaremos o seguinte:
[cassandra] name = DataStax Repo para Apache Cassandra baseurl = http://rpm.datastax.com/community enabled = 1 gpgcheck = 0
etapa 3
Nós salvamos as alterações usando a combinação de teclas
Ctrl + O
e saímos do editor usando as teclas
Ctrl + X
Passo 4
Agora, será necessário atualizar os pacotes do repositório executando o seguinte:
sudo yum update -yEtapa 5
Agora podemos instalar o Cassandra executando o seguinte comando:
sudo yum install dsc20 -y
PROLONGAR
Etapa 6
Depois de baixado e instalado, veremos o seguinte:
PROLONGAR
Etapa 7
Assim que o Cassandra estiver instalado, prosseguimos com a execução dos seguintes comandos:
sudo systemctl start cassandra (iniciar o serviço Cassandra) sudo systemctl enable cassandra (ativar o serviço Cassandra na inicialização do sistema)
PROLONGAR
Etapa 8
Por fim, podemos ver o status do Cassandra executando o seguinte comando:
sudo systemctl status cassandra
PROLONGAR
3. Conecte e verifique o cluster Cassandra no CenTOS 7
Passo 1
Neste ponto o Cassandra está funcionando, então vamos verificar e conectar o Cluster Cassandra, para isso, primeiramente, vamos verificar o status do Cluster Cassandra com o seguinte comando:
sudo nodetool status
Passo 2
Podemos ver que o status da conexão do cluster está correto. Neste ponto, a Solvetic deseja adicionar um ponto de solução porque em muitas ocasiões, ao executar este comando, o seguinte erro é exibido:
Erro: falha ao conectar a ‘127.0.0.1:7199’: conexão recusada (Cassandra)etapa 3
Para resolver este erro e acessar corretamente devemos ir ao seguinte diretório utilizando o editor desejado:
sudo nano /etc/cassandra/default.conf/cassandra-env.shPasso 4
Lá devemos localizar a seguinte linha:
JVM_OPTS = "$ JVM_OPTS -Djava.rmi.server.hostname =Etapa 5
A aparência deve ser semelhante ao seguinte texto:
# adicione isto se você estiver tendo problemas para conectar: # JVM_OPTS = ”$ JVM_OPTS -Djava.rmi.server.hostname =”Etapa 6
Devemos remover o comentário da segunda linha e substituir a linha do nome público pelo endereço IP 127.0.0.1:
Etapa 7
Salvamos as alterações usando a seguinte combinação de teclas:
Ctrl + O
Saímos do editor usando:
Ctrl + X
Etapa 8
Prosseguimos para reiniciar o serviço executando o seguinte:
systemctl reiniciar cassandraEtapa 9
Em alguns casos é recomendável reiniciar o computador, desta forma corrigiremos este erro.
Agora podemos nos conectar ao cluster Cassandra executando o seguinte comando:
cqlsh
Etapa 10
Podemos ver a respectiva conexão para começar a trabalhar neste banco de dados. Para sair, usaremos o termo
saídaDesta forma, vimos como instalar e acessar o Cassandra no CentOS 7.