Saltar al contenido.

Entradas de la Categoría ‘“Big Data” y su análisis’

El futuro de la mercadotecnia

Para aquellos que están interesados en los temas de tecnología y mercadotecnia, anexo les incluyo una presentación que realicé hace un par de meses en la escuela. El objetivo de esta presentación es brindar una visión sobre lo que podría ser el futuro de la mercadotecnia gracias al internet de las cosas.

La tesis principal de mi investigación es que a medida que el mundo digital converja con el mundo real, las habilidades de los departamentos de mercadotecnia de empresas digitales y tradicionales deben converger de la misma manera.

Si les interesa el tema, aquí encontrarán el reporte completo.

http://www.tuck.dartmouth.edu/digital/assets/images/Internet_of_things.pdf

Anuncios

Entrevista con Tom Mills (Google)

El otro día tuve la oportunidad de entrevistar a Tom Mills (Global Director of Enterprise Education en Google). Tom visitó la escuela para participar en un foro junto con varios ejecutivos de Amazon, IBM y otras empresas de tecnología. Si les interesa la entrevista, pueden verla aquí. Si quieren ver el foro en el que participó Tom, pueden ver el video acá. Por cierto el título del foro fue: “Innovation on Demand – The Promise of Cloud Computing”.

Al igual que con las otras entrevistas, pido una disculpa por mi acento al hablar inglés.

Crónica de un fin de semana – Analizando Patentes

¿Es posible el analizar las patentes que van siendo aprobadas para encontrar patrones y predecir el futuro? Intentar responder esta pregunta me hizo perder alrededor de 30 horas en un fin de semana.

Aunque obviamente no pude encontrar la manera de analizar las patentes (y estoy exageradamente lejos de lograrlo), el intentar responder mi pregunta me hizo descubrir varios servicios muy interesantes que compartiré con ustedes en este post.

¿Cómo crear una araña web?

Una araña web (web crawler en inglés) es un programa que analiza páginas de Internet de manera metódica y automatizada. Google usa arañas web para extraer contenido, indexarlo y proveer resultados de búsqueda. El intentar crear una araña de web para extraer información de la página de patentes de Estados Unidos me hizo descubrir el servicio de 80legs.com. Esta empresa permite a cualquier usuario el crear arañas de manera gratuita sin la necesidad de saber programar. Aquellos que quieran extraer todo el texto de un directorio pueden usar los servicios de esta página. Obviamente antes de hacerlo deben de investigar si es legal hacerlo.

¿Cómo automatizar tareas?

Si bien es cierto que se puede usar 80legs para extraer contenido de la página de patentes, los servicios de esta página no eran lo suficientemente rápidos ni me ofrecían las opciones que yo necesitaba para mi análisis. Por tal motivo decidí investigar alternativas y descubrí un programa llamado irobot (que se puede descargar de http://irobotsoft.com/). Este programa tiene una interface relativamente sencilla y permite automatizar tareas como el llenado de formas, abrir páginas de internet y grabar información en una base de datos. El único problema de este programa es que requiere un poco de conocimiento de HTQL. Afortunadamente, no es tan complicado el aprender HTQL si se tiene conocimiento de HTML. Con irobot pude crear una base de datos que contiene los resúmenes, autores y fecha de publicación de las patentes relacionadas a mercadotecnia que se crearon en los últimos años.

¿Cómo analizar texto?

Tras crear una base de datos con información sobre patentes mi siguiente reto fue el analizar dicha información. Tras hacer una búsqueda en Google y leer varios artículos sobre análisis de textos, encontré los servicios de AlchemiAPI.com. En esta página puedes poner texto y recibir los conceptos claves del texto y relaciones entre palabras. Una vez que identifique los términos relevantes en mi base de datos de patentes, decidí ver cuántas veces aparecía cada concepto en cada patente y usar un algoritmo para crear clústers (k-means) para encontrar patrones. Para mi tristeza no encontré nada interesante.

¿Cómo encontrar patrones?

Mi frustración me hizo buscar empresas que hagan todo el análisis de una base de datos. Buscando en Internet encontré que Google ofrece una herramienta para analizar Big Data. A través de un API que se encuentra en la página https://developers.google.com/prediction/, es posible el analizar bases de datos y hacer predicciones. Lo único que se requiere para lograr este objetivo es una base de datos que contenga datos para generar un modelo (supongo que Google usa neural networks para hacer sus predicciones). Leer esto me hizo acordarme de Mechanical Turk (servicio del cual escribí aquí hace algunos días) para crear el archivo de entrenamiento. No obstante, este proyecto tomaría demasiado esfuerzo y creo que no tengo tiempo suficiente para hacerlo. Fue a esta altura (y tras haber pasado mucho tiempo frente al monitor) cuando decidí rendirme.

¿Malgasté un fin de semana?

Espero que no. Si bien es cierto que uno de mis amigos me preguntó ¿Y qué lograste con todo esto? Y no pude responderle, creo que algún día podré conectar todas estas herramientas que estoy descubriendo.  A final de cuentas vine a la escuela a aprender algo nuevo.

La mercadotecnia del futuro

Desde hace varios años se han ido presentado cambios en la industria y función de la mercadotecnia. La abundancia de la información, las redes sociales, y los nuevos modelos de negocio se han encargado de hacer obsoletos los departamentos tradicionales de mercadotecnia.

Según Forrester 75% de los CMOs (Chief Marketing Officers) afirmaron que iban a hacer cambios drásticos en sus departamentos a finales del año pasado y según Accenture solamente 4% de los gerentes de mercadotecnia se sienten preparados para explotar oportunidades que surgen por las tecnologías digitales.

Tras realizar un pequeño experimento en Linkedin, en el cual me puse a examinar las posiciones de “Gerente de Mercadotecnía” (i.e. Marketing Manager) que estaban publicadas el 17 de Enero del 2012 (día que hice el experimento) fue impresionante ver las habilidades que son requeridas por las empresas.

La gráfica nos muestra el porcentaje de las vacantes que contenía cada palabra/habilidad. Las barras rojas son conceptos que por lo general son asociados con mercadotecnia (i.e. precios, segmentos, marca, etc.) mientras que las barras rojas son habilidades o palabras que son asociadas con tecnología.

Sobra decir que vivimos en un mundo dónde Search Engine Optimization (SEO) es tan importante que tener conocimientos sobre Branding.

Adwords, SQL, HTML…

¿Cuántas de estas habilidades poseen los profesionistas actuales?

Escasez de talento

Hace unos días, el McKinsey Global Institute (el think tank de McKinsey) publicó un reporte muy interesante sobre “Big Data”. Dentro de este reporte, una sección que me llamó mucho la atención es aquella que concluye que va a haber una escasez de talento en los siguientes años.

A pesar de que la tasa de desempleo en Estados Unidos se encuentra en casi el 9%, McKinsey concluye de que para el año 2018, la demanda de personas que sepan analizar información va a exceder la oferta. De hecho, según la gráfica del reporte, dicha demanda va a ser entre 50 y 60% mayor que la cantidad de personas disponibles incluso después de haber tomado en cuenta factores como inmigración.

Ver esta gráfica me hizo recordar que hace un mes un amigo que va a trabajar en Amazon durante el verano le preguntó a uno de los empleados actuales de dicha organización…

¿Qué puedo hacer para prepararme y estar listo para el trabajo?

La respuesta que obtuvo…

“Aprende MySQL”

Nota: mi amigo no va a trabajar en un grupo de tecnología sino en una posición de comercio al menudeo.

Información

Un dato que leí hace tiempo y me dejó pensando…

Según el CEO de Google, cada dos días creamos la misma cantidad de información que la que generó la raza humana desde los inicios de la civilización hasta el año 2003.

Este dato es tan asombroso que lo debo repetir… “En dos días estamos creando lo mismo que al resto de la raza humana le tomó miles de años. “

Esto me hace recordar la pirámide de la sabiduría que dice que los datos no equivalen a tener información, que información no es lo mismo que conocimiento y que conocimiento no se traduce en sabiduría. No obstante, a pesar de que nos encontramos todavía en la base de la piramide (datos), creo que es extremadamente interesante vivir en esta época. Hay tanto potencial y tantas cosas que podrían ocurrir debido a la abundancia de información que no logro visualizar lo que el futuro nos va a traer.

Pull (David Siegel) – Libro

Hace un par de días terminé de leer el libro de David Siegel titulado “Pull”. La única razón por la cual compré este libro es porque el autor afirma conocer el futuro del Internet; algo demasiado ambicioso desde mi punto de vista.

Este autor afirma que el Internet va a dejar de ser un sistema en el cual se empuja información (Push) para convertirse en uno en el que se jalan soluciones (Pull) a través de la creación de contenido semántico.

Dado que no creo que haga sentido lo que estoy escribiendo (a menos que sepan sobre este tema), creo que es más fácil explicar esta idea a través de ejemplos…

  • El día de hoy, si quisiéramos saber que museos están abiertos los fines de semana en la ciudad de México, solamente podríamos obtener esta respuesta si nos metemos a las páginas de Internet de cada museo. Es decir, a pesar de que la información está disponible, Google no puede darnos respuestas.
  • A pesar de que las farmacias tienen recibos y facturas de todo lo que compramos, sería imposible para nosotros el calcular cuánto dinero hemos gastado en medicinas en los últimos cinco años.  Una vez más la información está disponible pero no la respuesta.
  • Las personas que buscan trabajo deben subir su curriculum a varias páginas de Internet y los empleadores deben a su vez buscar candidatos en un mercado imperfecto. No obstante… ¿Por qué hay que publicar un curriculum en varios lugares?

¿Por qué tenemos que llenar cientos de formas todos los años? ¿Por qué no es posible generar información tan solo una vez y usarla cuántas veces queramos? Esta es la pregunta que David Siegel se hace y es a través de esta pregunta que el autor brinda una perspectiva sobre lo que podría ser el futuro.

Siegel afirma que la creación de Metadata (datos que explican el contenido de otros datos) va a tener un crecimiento exponencial al igual que los sistemas que van a procesar estos datos. El manejar efectivamente la información va a poder permitirnos el eliminar todo el gasto y la ineficiencia que ocurre en nuestra vida.

Siegel es muy bueno en brindar una visión muy clara de lo que podría ser el futuro. No obstante, tal y cómo ocurre en toda visión, los datos duros o la evidencia no son muy fuertes. Mientras que el libro es muy bueno para encontrar ejemplos de empresas de alta tecnología, la verdad creo que el autor es un poco simplista en temas como el de salud e impuestos.

Diría que este libro es bueno solamente para tener una perspectiva general sobre lo que es la red semántica.

Aprendiendo Neural Networks (Redes Neuronales)

Los Neural Networks son una herramienta/algoritmo que busca patrones en una base de datos. Esta herramienta intenta imitar la forma en la que funciona el cerebro humano en el sentido que obtiene información del exterior y aprende a través de la experiencia.

Por ejemplo, un auditor de impuestos tiene experiencia que le permite identificar a las personas que hacen fraudes en su declaración de impuestos. Gracias a su experiencia, los auditores reconocen declaraciones fraudulentas usando su “intuición” que no es más que conexiones que el cerebro hace entre variables.

Leer Más

We feel fine – Analizando los sentimientos de la raza humana

“We feel fine” Esta página analiza millones de Blogs todos los días y extrae frases de los mismos para entender los sentimientos de los seres humanos de manera agregada. Específicamente, este software/algoritmo/herramienta busca la frase “I feel __________”en miles de Blogs cada minuto. Una vez que encuentra estas frases las graba en un servidor con la ubicación, sexo y edad del autor. Posteriormente un software clasifica cada enunciado en sentimientos específicos que incluyen alegría, tristeza, miedo, esperanza y otros 5000 sentimientos “predefinidos”. Finalmente, esta página nos muestra la información de manera consolidada como una obra de arte con todos los pensamientos de los seres humanos flotando en un océano de sentimientos.

Leer Más