{"id":3215,"date":"2020-06-04T08:01:10","date_gmt":"2020-06-04T13:01:10","guid":{"rendered":"https:\/\/www.hostdime.com.pe\/blog\/?p=3215"},"modified":"2020-06-04T09:15:40","modified_gmt":"2020-06-04T14:15:40","slug":"comprender-las-caracteristicas-de-big-data","status":"publish","type":"post","link":"https:\/\/www.hostdime.com.pe\/blog\/comprender-las-caracteristicas-de-big-data\/","title":{"rendered":"Comprender las caracter\u00edsticas de Big Data"},"content":{"rendered":"<p style=\"text-align: justify;\">Comprender las caracter\u00edsticas de Big Data. El hecho de que las organizaciones enfrentan desaf\u00edos de Big Data es com\u00fan hoy en d\u00eda. El t\u00e9rmino Big Data se refiere al uso de un conjunto de m\u00faltiples tecnolog\u00edas, tanto antiguas como nuevas, para extraer informaci\u00f3n significativa de una gran cantidad de datos.<!--more--><\/p>\n<p style=\"text-align: justify;\">El conjunto de datos no solo es grande, sino que tambi\u00e9n tiene su propio conjunto \u00fanico de desaf\u00edos para capturarlos, administrarlos y procesarlos. A diferencia de los datos que persisten en las bases de datos relacionales, que est\u00e1n estructuradas, el formato de big data puede ser estructurado, semiestructurado a no estructurado, o recopilarse de diferentes fuentes con diferentes tama\u00f1os. Este art\u00edculo profundiza en los aspectos fundamentales de <a href=\"https:\/\/pcweb.info\/que-es-big-data-definicion-significado-concepto\/\" target=\"_blank\" rel=\"noopener noreferrer\">Big Data<\/a>, sus caracter\u00edsticas b\u00e1sicas, y le da una pista de las herramientas y t\u00e9cnicas utilizadas para tratarlo.<\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_77 counter-hierarchy ez-toc-counter ez-toc-light-blue ez-toc-container-direction\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Table of Contents<\/p>\n<label for=\"ez-toc-cssicon-toggle-item-69f39142bbe93\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-69f39142bbe93\"  aria-label=\"Alternar\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/www.hostdime.com.pe\/blog\/comprender-las-caracteristicas-de-big-data\/#Una_vision_general\" >Una visi\u00f3n general<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/www.hostdime.com.pe\/blog\/comprender-las-caracteristicas-de-big-data\/#Explosion_de_informacion\" >Explosi\u00f3n de informaci\u00f3n<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/www.hostdime.com.pe\/blog\/comprender-las-caracteristicas-de-big-data\/#Particularidades_del_Big_Data\" >Particularidades del Big Data<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/www.hostdime.com.pe\/blog\/comprender-las-caracteristicas-de-big-data\/#Herramientas_y_tecnicas\" >Herramientas y t\u00e9cnicas<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/www.hostdime.com.pe\/blog\/comprender-las-caracteristicas-de-big-data\/#Conclusion\" >Conclusi\u00f3n<\/a><\/li><\/ul><\/nav><\/div>\n<h2 style=\"text-align: justify;\"><span class=\"ez-toc-section\" id=\"Una_vision_general\"><\/span><span style=\"color: #ff6600;\">Una visi\u00f3n general<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p style=\"text-align: justify;\"><a href=\"https:\/\/www.hostdime.com.pe\/blog\/comprender-las-caracteristicas-de-big-data\/una-vision-general-big-data-blog-hostdime\/\" rel=\"attachment wp-att-3236\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright wp-image-3236\" src=\"https:\/\/www.hostdime.com.pe\/blog\/wp-content\/uploads\/2020\/06\/Una-visi\u00f3n-general-Big-data-blog-HostDime.png\" alt=\"\" width=\"650\" height=\"366\" \/><\/a>El t\u00e9rmino Big Data da una impresi\u00f3n solo del tama\u00f1o de los datos. Esto es cierto en cierto sentido, pero no da la imagen completa. Los desaf\u00edos asociados con \u00e9l no son solo su tama\u00f1o solo. De hecho, la idea evolucion\u00f3 para nombrar un mar de datos recopilados de diversas fuentes, formatos y tama\u00f1os, y, al mismo tiempo, es dif\u00edcil aprovecharlos o sacarles provecho.<\/p>\n<p style=\"text-align: justify;\">El surgimiento de la tecnolog\u00eda emergente y el uso creciente de Internet dieron un impulso al volumen y la disparidad. El volumen sigue aumentando con cada intercambio de informaci\u00f3n a trav\u00e9s de Internet o incluso los min\u00fasculos objetos IoT que utilizamos.<\/p>\n<p style=\"text-align: justify;\">Un simple contestar una llamada telef\u00f3nica o encender el CCTV puede generar una cadena de datos. Hoy, la mayor\u00eda de los dispositivos est\u00e1n conectados en l\u00ednea. Ahora, si una organizaci\u00f3n quiere recopilar esa informaci\u00f3n en l\u00ednea, necesita un proceso de procesamiento especial porque los datos generados ser\u00e1n masivos. Adem\u00e1s, puede no haber uniformidad en el formato de los datos capturados. Esto se suma a la complejidad ya que tenemos que lidiar con datos estructurados, semiestructurados o no estructurados.<\/p>\n<p style=\"text-align: justify;\">Las herramientas que utilizamos hasta ahora para organizar los datos son incapaces de manejar tanta variedad y volumen. Por lo tanto, podemos decir que el t\u00e9rmino Big Data en realidad se aplica a los datos que no pueden procesarse o analizarse a trav\u00e9s de herramientas y t\u00e9cnicas tradicionales que normalmente se utilizan para procesar datos estructurados o semiestructurados, como el uso de bases de datos relacionales, XML, etc.<\/p>\n<p style=\"text-align: justify;\">Las organizaciones de hoy est\u00e1n repletas de datos no estructurados o semiestructurados disponibles en formato sin formato. Estos datos pueden ser una gran cantidad de informaci\u00f3n si se procesan y el valor se obtiene de ellos. Pero, el problema es c\u00f3mo hacerlo.<\/p>\n<p style=\"text-align: justify;\">Las t\u00e9cnicas y herramientas tradicionales, como las bases de datos relacionales, son inadecuadas para manejar un volumen tan grande de datos variados. Tambi\u00e9n es un problema de doble filo para las organizaciones, porque simplemente destruirlas significar\u00eda perder informaci\u00f3n valiosa, si es que la hay, y conservarlas es un desperdicio de recursos. Por lo tanto, se buscan algunas herramientas y t\u00e9cnicas para tratar el problema. A veces, estamos bastante seguros de su valor potencial en la pila y podemos cosechar una mina de oro de informaci\u00f3n, pero, sin las herramientas adecuadas, es bastante exigente para el proceso comercial obtener alg\u00fan beneficio. Los datos de hoy son masivos y explotaron como cualquier cosa en los \u00faltimos a\u00f1os; Parece que no hay forma de detenerlo, por cierto.<\/p>\n<h2 style=\"text-align: justify;\"><span class=\"ez-toc-section\" id=\"Explosion_de_informacion\"><\/span><span style=\"color: #ff6600;\">Explosi\u00f3n de informaci\u00f3n<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p style=\"text-align: justify;\">Big data se hace cada minuto m\u00e1s grande en casi todos los sectores, ya sea tecnolog\u00eda, medios, venta minorista, servicios financieros, viajes y redes sociales, por nombrar solo algunos. El volumen de procesamiento de datos del que estamos hablando es alucinante. Aqu\u00ed hay informaci\u00f3n estad\u00edstica para darle una idea:<\/p>\n<p style=\"text-align: justify;\">Los canales meteorol\u00f3gicos reciben 18,055,555 solicitudes de pron\u00f3stico por minuto.<br \/>\nLos usuarios de Netflix transmiten 97,222 horas de video por minuto.<br \/>\nLos usuarios de Skype realizan 176,220 llamadas por minuto.<br \/>\nLos usuarios de Instagram publican 49,380 fotos por minuto.<\/p>\n<p style=\"text-align: justify;\">Estos n\u00fameros est\u00e1n creciendo cada a\u00f1o, con un n\u00famero creciente de personas que usan Internet. En 2017, el uso de Internet alcanz\u00f3 hasta el 47% (3.800 millones de personas) de la poblaci\u00f3n mundial. Con un n\u00famero cada vez mayor de dispositivos electr\u00f3nicos, nuestros datos de salida aproximados se estiman en 2.5 quintillones de bytes por d\u00eda y en crecimiento.<\/p>\n<p style=\"text-align: justify;\">Las estad\u00edsticas de B\u00fasqueda de Google muestran 3.5 billones de b\u00fasquedas por d\u00eda, lo que representa m\u00e1s de 40,000 b\u00fasquedas por segundo en promedio . Tampoco debemos perder de vista que otros motores de b\u00fasqueda tambi\u00e9n est\u00e1n haciendo b\u00fasquedas. El Informe de estad\u00edsticas de correo electr\u00f3nico, 2015-2019 de Radicati Group, Inc., muestra 2.900 millones de usuarios de correo electr\u00f3nico para 2019.<\/p>\n<p style=\"text-align: justify;\">En un intento de estimar cu\u00e1ntas fotos se tomaron en 2019 : si hubiera 7,5 mil millones de personas en el mundo ese a\u00f1o, con aproximadamente 5 mil millones con tel\u00e9fonos m\u00f3viles, una suposici\u00f3n probable es que el 80% de esos tel\u00e9fonos tienen c\u00e1maras incorporadas. Eso significa que hay alrededor de 4 mil millones de personas que usan sus c\u00e1maras. Si toman 10 fotos por d\u00eda, lo que equivale a 3,650 fotos por a\u00f1o por persona, esto suma aproximadamente 14 billones de fotos tomadas por a\u00f1o.<\/p>\n<p style=\"text-align: justify;\">Por lo tanto, cuando decimos Big Data, se refiere esencialmente a datos o conjuntos de registros que son demasiado grandes para ser previsibles. Se producen a trav\u00e9s de los motores de b\u00fasqueda, inform\u00e1tica empresarial, redes sociales, redes sociales, gen\u00f3mica, meteorolog\u00eda, pron\u00f3sticos meteorol\u00f3gicos y muchas otras fuentes. Esto claramente no puede ser operado usando las herramientas y t\u00e9cnicas de administraci\u00f3n de bases de datos existentes. Big Data abre una arena de grandes desaf\u00edos en t\u00e9rminos de almacenamiento, captura, administraci\u00f3n, mantenimiento, an\u00e1lisis, investigaci\u00f3n, nuevas herramientas para manejarlos y similares.<\/p>\n<h2 style=\"text-align: justify;\"><span class=\"ez-toc-section\" id=\"Particularidades_del_Big_Data\"><\/span><span style=\"color: #ff6600;\">Particularidades del Big Data<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p style=\"text-align: justify;\">Como con todas las cosas importantes, si queremos gestionarlas, debemos caracterizarlas para organizar nuestra comprensi\u00f3n. Por lo tanto, Big Data puede definirse por una o m\u00e1s de tres caracter\u00edsticas, las tres V: alto volumen , alta variedad y alta velocidad . Estas caracter\u00edsticas plantean algunas preguntas importantes que no solo nos ayudan a descifrarlo, sino que tambi\u00e9n nos dan una idea de c\u00f3mo lidiar con datos masivos y dispares a una velocidad manejable dentro de un marco de tiempo razonable para que podamos sacarle provecho. an\u00e1lisis en tiempo real, y proporcionar una respuesta posterior r\u00e1pidamente.<\/p>\n<ul>\n<li style=\"text-align: justify;\">Volumen: El volumen se refiere al gran tama\u00f1o de los datos cada vez m\u00e1s explosivos del mundo inform\u00e1tico. Plantea la pregunta sobre la cantidad de datos.<\/li>\n<li style=\"text-align: justify;\">Velocidad: la velocidad se refiere a la velocidad de procesamiento. Plantea la cuesti\u00f3n de a qu\u00e9 velocidad se procesan los datos.<\/li>\n<li style=\"text-align: justify;\">Variedad: Variedad se refiere a los tipos de datos. Plantea la cuesti\u00f3n de cu\u00e1n dispares son los formatos de datos.<\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Tenga en cuenta que caracterizamos Big Data en tres V, solo para simplificar sus principios b\u00e1sicos. Es muy posible que el tama\u00f1o sea relativamente peque\u00f1o, pero muy variado y complejo, o puede ser relativamente simple pero con un gran volumen de datos.<\/p>\n<p style=\"text-align: justify;\">Por lo tanto, adem\u00e1s de estas tres V, podemos agregar f\u00e1cilmente otra, Veracidad. La veracidad determina la precisi\u00f3n de los datos en relaci\u00f3n con el valor comercial que queremos extraer. Sin veracidad, es inviable que una organizaci\u00f3n aplique sus recursos para analizar la pila de datos. Con m\u00e1s precisi\u00f3n en cuanto al contexto de los datos, hay una mayor posibilidad de obtener informaci\u00f3n valiosa. Por lo tanto, la veracidad es otra caracter\u00edstica de Big Data. Las empresas aprovechan los datos estructurados, semiestructurados y no estructurados del correo electr\u00f3nico, las redes sociales, las transmisiones de texto y m\u00e1s. Pero, antes del an\u00e1lisis, es importante identificar la cantidad y los tipos de datos en consideraci\u00f3n que impactar\u00edan los resultados del negocio.<\/p>\n<h2 style=\"text-align: justify;\"><span class=\"ez-toc-section\" id=\"Herramientas_y_tecnicas\"><\/span><span style=\"color: #ff6600;\">Herramientas y t\u00e9cnicas<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p style=\"text-align: justify;\">La <a href=\"https:\/\/www.hostdime.com.pe\/blog\/ia-inteligencia-artificial-servicio-malware-hackers\/\" target=\"_blank\" rel=\"noopener noreferrer\">Inteligencia Artificial<\/a> (IA), IoT y las redes sociales est\u00e1n impulsando la complejidad de los datos a trav\u00e9s de nuevas formas y fuentes. Por ejemplo, es crucial que, en tiempo real, los datos grandes que ingresan a trav\u00e9s de sensores, dispositivos, redes, transacciones se capturen, administren y procesen con baja latencia. Big Data permite a los analistas, investigadores y usuarios de negocios tomar decisiones m\u00e1s informadas con mayor rapidez, utilizando datos hist\u00f3ricos que de otro modo ser\u00edan inalcanzables. Se puede utilizar el an\u00e1lisis de texto, el aprendizaje autom\u00e1tico, el an\u00e1lisis predictivo, la miner\u00eda de datos y el procesamiento del lenguaje natural para extraer una nueva visi\u00f3n de la pila de datos disponible.<\/p>\n<p style=\"text-align: justify;\">La tecnolog\u00eda ha evolucionado para gestionar grandes vol\u00famenes de datos, que anteriormente eran caros y ten\u00edan que contar con la ayuda de supercomputadoras. Con la aparici\u00f3n de las redes sociales como Facebook, los motores de b\u00fasqueda como Google y Yahoo !, los proyectos de Big Data cobraron impulso y crecieron como lo son hoy. Se han desarrollado tecnolog\u00edas como MapReduce, Hadoop y Big Table para satisfacer las necesidades de hoy.<\/p>\n<p style=\"text-align: justify;\">Los repositorios NoSQL tambi\u00e9n se mencionan en relaci\u00f3n con Big Data. Es una base de datos alternativa en contraste con las bases de datos relacionales. Estas bases de datos no organizan registros en tablas de filas y columnas como se encuentran en las bases de datos relacionales convencionales. Existen diferentes tipos de bases de datos NoSQL, como Content Store, Document Store, Event Store, Graph, Key Value y similares. No usan SQL para consultas y siguen un modelo arquitect\u00f3nico diferente. Se encuentran para facilitar Big Data Analytics de manera favorable. Algunos nombres populares son: Hbase, MongoDB, CouchDB y Neo4j. Aparte de ellos, hay muchos otros.<\/p>\n<h2 style=\"text-align: justify;\"><span class=\"ez-toc-section\" id=\"Conclusion\"><\/span><span style=\"color: #ff6600;\">Conclusi\u00f3n<\/span><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p style=\"text-align: justify;\">Big Data abri\u00f3 una nueva oportunidad para la recolecci\u00f3n de datos y la extracci\u00f3n de valor, que de otro modo estar\u00edan desperdiciando. Es imposible capturar, administrar y procesar Big Data con la ayuda de herramientas tradicionales como bases de datos relacionales. La plataforma Big Data proporciona las herramientas y los recursos para extraer informaci\u00f3n de los voluminosos, diversos y la velocidad de los datos.<\/p>\n<p style=\"text-align: justify;\">Estas pilas de datos ahora tienen medios y un contexto viable para ser utilizados con diversos fines en el proceso comercial de una organizaci\u00f3n. Por lo tanto, para determinar exactamente qu\u00e9 tipo de datos estamos hablando, debemos entenderlo y sus caracter\u00edsticas como el paso principal.<\/p>\n<p>Ver otros recursos relacionados:\u00a0<a href=\"https:\/\/www.hostdime.com.pe\/blog\/por-que-los-centros-de-datos-de-hiperescala-estan-aqui-para-quedarse\/\" target=\"_blank\" rel=\"noopener noreferrer\">\u00bfPor qu\u00e9 los centros de datos de hiperescala est\u00e1n aqu\u00ed para quedarse?<\/a> ; <a href=\"https:\/\/blog.hostdime.com.co\/desventajas-contras-del-big-data\/\" target=\"_blank\" rel=\"noopener noreferrer\">desventajas y contras del Big data<\/a>; <a href=\"https:\/\/www.hostdime.la\/blog\/que-es-big-data-analytics-porque-necesito-para-mi-negocio\/\" target=\"_blank\" rel=\"noopener noreferrer\">qu\u00e9 es Big data analytics y porqu\u00e9 lo necesito para mi negocio<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Comprender las caracter\u00edsticas de Big Data. El hecho de que las organizaciones enfrentan desaf\u00edos de Big Data es com\u00fan hoy en d\u00eda. El t\u00e9rmino Big Data se refiere al uso de un conjunto de m\u00faltiples tecnolog\u00edas, tanto antiguas como nuevas, [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":3231,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[],"class_list":["post-3215","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/posts\/3215","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/comments?post=3215"}],"version-history":[{"count":0,"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/posts\/3215\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/media\/3231"}],"wp:attachment":[{"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/media?parent=3215"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/categories?post=3215"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.hostdime.com.pe\/blog\/wp-json\/wp\/v2\/tags?post=3215"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}