Tomado de: Articulo Original
Cassandra es un motor de bases de datos de las llamadas “No-SQL”, o no relacionales.
En un principio, Cassandra, fue diseñada por Facebook para gestionar de forma eficiente su ingente cantidad de datos, posteriormente, en 2008, se liberó su código pasando a manos de Apache Software Foundation, quien lo ha convertido en un proyecto estable y está contribuyendo en su desarrollo y gestión.
Unos ejemplos de entidades que usan esta base de datos son Digg, Cisco, Rackspace o IBM, y últimamente, se está hablando mucho de la migración de Twitter desde su sistema MySQL, a Cassandra, debido a la gran cantidad y gran incremento de información a la que se está viendo sometida esta red social.
Su modelo de datos está basado en el sistema BigTable de Google, y en Dynamo, este modelo se asienta sobre un par Key/Value siendo su
principal característica la posibilidad de almacenar registros de una forma contínua y ordenada y la definición de Columnas y Supercolumnas (columnas de columnas).
Observando la arquitectura del motor de base de datos de “Cassie”, nos encontramos con un gran interrogante, ¿Qué preferimos en nuestra base de datos?, consistencia de datos, o latencia, bien, pues esto no va a ser problema con Cassandra, ya que nos permite ajustar el tiempo de respuesta (latencia), y la consistencia de los datos a nuestro antojo y según nuestras necesidades.
La característica más importante de Cassandra es su alta ESCALABILIDAD y la gestión de los datos entre una serie de servidores o nodos de un clúster. Estos nodos se añaden al clúster de forma horizontal de modo que nuestra información es procesada automáticamente por el sistema, quien se encarga de hacer el balanceado y mantener la consistencia en los nodos ya existentes y en el nodo recién añadido. Esta característica es la que hace especial a Cassandra, ya que al igual que el balanceado de datos y el manejo de la consistencia se hace de forma automática al añadir un nodo, también se encarga de realizar la misma operación si algún nodo se pierde, y con esto aunque el servidor esté caído, no veremos afectados nuestros datos por esta eventualidad.
En un principio, Cassandra, fue diseñada por Facebook para gestionar de forma eficiente su ingente cantidad de datos, posteriormente, en 2008, se liberó su código pasando a manos de Apache Software Foundation, quien lo ha convertido en un proyecto estable y está contribuyendo en su desarrollo y gestión.
Unos ejemplos de entidades que usan esta base de datos son Digg, Cisco, Rackspace o IBM, y últimamente, se está hablando mucho de la migración de Twitter desde su sistema MySQL, a Cassandra, debido a la gran cantidad y gran incremento de información a la que se está viendo sometida esta red social.
Su modelo de datos está basado en el sistema BigTable de Google, y en Dynamo, este modelo se asienta sobre un par Key/Value siendo su
principal característica la posibilidad de almacenar registros de una forma contínua y ordenada y la definición de Columnas y Supercolumnas (columnas de columnas).
Observando la arquitectura del motor de base de datos de “Cassie”, nos encontramos con un gran interrogante, ¿Qué preferimos en nuestra base de datos?, consistencia de datos, o latencia, bien, pues esto no va a ser problema con Cassandra, ya que nos permite ajustar el tiempo de respuesta (latencia), y la consistencia de los datos a nuestro antojo y según nuestras necesidades.
La característica más importante de Cassandra es su alta ESCALABILIDAD y la gestión de los datos entre una serie de servidores o nodos de un clúster. Estos nodos se añaden al clúster de forma horizontal de modo que nuestra información es procesada automáticamente por el sistema, quien se encarga de hacer el balanceado y mantener la consistencia en los nodos ya existentes y en el nodo recién añadido. Esta característica es la que hace especial a Cassandra, ya que al igual que el balanceado de datos y el manejo de la consistencia se hace de forma automática al añadir un nodo, también se encarga de realizar la misma operación si algún nodo se pierde, y con esto aunque el servidor esté caído, no veremos afectados nuestros datos por esta eventualidad.
Video donde se explica la utilizacion de Base de datos NOSQL
Instalación de Cassandra DB en Windows.
Para instalar Cassandra en Windows, procedemos de la siguiente forma:
Lo primero que debemos hacer es descargarnos el archivo de la base de datos desde la siguiente dirección:
http://www.cassandra.apache.org
Actualmente se encuentra en la versión 0.7.0.
Una vez obtenemos el fichero, lo descomprimimos en C:
Para que funcione nuestra base de datos, debemos crear dos variables de entorno, para lo que haremos lo siguiente:
En equipo, pongo el ratón sobre el icono y pulso el botón derecho, y en la pestaña que aparece me voy a propiedades, dentro de propiedades, pulso en configuración avanzada del sistema y en las pestañas superiores que nos aparecen, me muevo a la que tiene el título de “Variables de Entorno”.
En las variables de entorno, puedo observar tres opciones, “Nueva”, “Editar”, “Eliminar”, pinchamos en el botón “Nueva”, y aparece un cuadro de diálogo con dos opciones para rellenar:
“Nombre de la Variable”, y “Valor de la variable”.
En el primer campo pongo lo siguiente: JAVA_HOME
En el segundo campo, escribo la dirección donde se encuentra nuestro jdk, que en mi caso sería en el siguiente directorio:
C: \Program Files\Java\jdk1.6.0_17
Hecho esto, le doy a aceptar, y ya tenemos la primera de las dos variables de entorno creadas.
La segunda variable, se crea de la misma forma, y en el campo del nombre debemos poner lo siguiente CASSANDRA HOME y en la dirección, el directorio donde se encuentra la carpeta cassandra que descomprimimos anteriormente.
Después de establecer las variables de entorno, se inicia el servidor Cassandra abriendo la línea de comandos y escribiendo lo siguiente:
cd..
cd..
cd apache-cassandra-0.7.0
cd bin
cassandra -start
El resultado es el inicio del motor de la base de datos, que debe quedar en espera a la escucha de los clientes de Thrift.
1 comentario:
hola disculpa una pregunta.. es que ya agregue las variables de entorno pero me sale esto...
"El sistema no puede encontrar la ruta especificada" A que se debe te lo agradecere muchiiisimo es para una practica ^_^
Publicar un comentario