Saltar al contenido →

Etiqueta: Búsqueda Información

Documentarse en tiempos de IA

Dos estudiantes de Massachussets (EEUU) fueron descubiertos utilizando una Inteligencia Artificial para la generación de textos en un trabajo escolar y sancionados. Hay que aclarar que no fueron sancionados por usar una IA per se, puesto que estaba permitido su uso para documentarse y buscar fuentes, sino por copiar y pegar textos de forma literal que, para su mala fortuna, la IA se había inventado (aunque es un caso frecuente). Esta noticia sorprende por las consecuencias que puede acarrear a los dos estudiantes, ya que es posible que no puedan acceder a estudios universitarios.

Además, con cierta perspectiva, se nos hace más difícil imaginar un uso cotidiano en el que no se pueda aplicar el uso de las Inteligencias Artificiales Generativas como ChatGPT. Las grandes empresas tecnológicas se encuentran en una carrera hacia el despliegue y la implementación de este tipo de soluciones en el día a día como el próximo The next big thingtecnológico. Microsoft, Apple, Samsung o Google se afanan en integrarlas dentro de sus dispositivos para su utilización de forma masiva, lo que las popularizará aún más. Por lo que se producirán más situaciones de uso que puede ser considerado dentro de ciertos ámbitos como no lícito o inadecuado.

No hace tanto tiempo que, para documentarse, el usuario debía realizar una tarea de filtrado exhaustiva. Saltando de ficha en ficha en formato de cartulina, almacenadas en grandes archivadores de madera y recorriendo estanterías hasta localizar el libro a consultar que debía abrir, leer (aunque fuese un capítulo específico) y determinar aquello que consideraba más interesante para hacer referencia en su trabajo de investigación. Era un trabajo de síntesis intenso y en ocasiones inabarcable, que fue haciéndose más cómodo, pero no por ello más sencillo. Como otras tareas, las referencias bibliográficas se fueron digitalizando y volcando en bases de datos para localizar de forma más rápida la información que se encontraba todavía en soporte papel. El proceso no acabó ahí, ya que la digitalización fue imparable y prácticamente todo el conocimiento se fue trasladando a bits para hacerlo en buena medida accesible en cualquier parte y a cualquier hora.

Google llegó con una misión ambiciosa, hacer todo el conocimiento accesible para todo el mundo y se convirtió en el buscador de referencia para los internautas. Ya no se salta de referencia bibliográfica a referencia bibliográfica, más bien de enlace a enlace para extraer aquello que nos parece más significativo de una página web o de un documento que se quiera consultar.

A pesar de esta nueva accesibilidad a una mayor de información, no había olvidar que en cualquier supuesto hay que tener presente qué se debe de considerar una fuente de información fiable y qué no. Lamentablemente, parece que los automatismos de las IAs nos hacen bajar la guardia como nos sucede en las redes sociales, condenados en una vida de consumo digital acelerado. Olvidamos que las IAs son solo herramientas a nuestro servicio. Su capacidad de consultar distintas fuentes, de extraer la información y estructurarla nos pueden llevar a la conclusión de que lo que nos exponen de forma tan razonada puede ser cierto, pero olvidamos que nosotros somos el último filtro. Debemos ser capaces de evaluar qué fuentes de información son mejores y en qué grado debemos confiar la información que nos exponen. Para ello, sólo deberíamos confiar en aquellas que hacen referencia a fuentes que puedan ser consultadas y que podamos comprobar.

Las IAs hacen un trabajo que antes podría llevarnos meses y tienen un potencial inmenso para ayudar al ser humano en la generación de conocimiento. Pero debe ser el ser humano el que evalúe esa información, el que la entienda y, por supuesto, que la supervise. De lo contrario, estaremos delegando y dando por bueno un sistema que está diseñado para satisfacer nuestras necesidades, olvidando que nunca admitirá “no lo sé”, “no tengo acceso” o “no lo he encontrado” (en algunos casos) y nos hará caer en la trampa de la desinformación que justo tratamos de evitar.

Deja un comentario

Qué es el Google Dorking

Las técnicas de Google Dorking, también denominadas Google Hacking, consisten en utilizar comandos de búsqueda avanzados de Google para obtener información que no se obtienen mediante técnicas normales de búsqueda. Estos comandos de búsqueda van desde el conocido “site” o “title”, sin embargo pueden ser usados como técnicas de hackeo de páginas web o servidores.

El término de Google Hacking fue utilizado por primera vez en 2002 por Johnny Long. Long comenzó a recopilar comandos de búsqueda en Google que dejaban al descubierto sistemas vulnerables o información sensible (números de la seguridad social o incluso números de tarjetas de crédito) y comenzó a etiquetarlos como GoogleDorks. Finalmente, debido al interés por su iniciativa creó la Google Hacking Database donde se recopilan todas estas ecuaciones de búsqueda.

El objetivo de esta recopilación es que los responsables de los sitios web realicen las búsquedas por ellos mismos como método preventivo y que sean capaces de detectar esos errores y fugas de información.

Estas técnicas de hackeo hacia servidores y sitios web se han extendido tanto hacia otros buscadores como Bing y hacia otros dispositivos conectados en la Web como dispositivos IoT.

Comentarios cerrados

La indigencia informativa

Entre los logros más relevantes de la sociedad de la información se halla la facilidad con que el individuo se puede documentar, mantenerse informado e intercambiar conocimientos. Sin embargo, […] el problema actual es la voluntad real de comprensión entre las personas, la carencia de una cultura común de respeto y la manipulación por sobreabundancia informativa. Una noticia dicha por múltiples canales se reconoce como verdad, aunque esos medios respondan a intereses comerciales similares e ilegitimen el punto de vista del emisor de la información.

Si bien se disfruta de una disponibilidad de información que era impensable unos años atrás, se requiere de una alfabetización digital profunda (es decir; nuevamente acceder, administrar, integrar, evaluar y crear información), para no resultar confundidos en un entorno de gran escasez de atención. Existen múltiples fuentes de información, aunque pocas voces son independientes. Leer o ver una decena de veces el mismo abordaje de una noticia no es estar más y mejor informado.

COBO ROMANÍ, Cristóbal; PARDO KUKLINSKI, Hugo. Planeta Web 2.0. Inteligencia colectiva o medios fast food. Barcelona: Universitat de Vic, 2007. p. 91

3 comentarios

La biblioteca de los libros mal clasificados

Uno de los problemas más graves de los productos es que nos obligan a hacer clasificaciones estáticas y muy simplistas, como vimos en Wal-Mart. Esto significa que una cazadora puede estar en la sección "Americanas" o "Deportes", pero no en la sección "Vaqueros" o "Nailon". Por lo general, esto no representa un gran problema, ya que casi todas estas categorías son insignificantes para la mayoría de la gente (las economías del comercio minorista deben ignorar a los pocos compradores para los que estas categorías serían perfectas).

Como gerente de una tienda, uno tiene que prever dónde la mayoría de la gente espera encontrar una cazadora. De modo que, después de construir su tienda en torno a una clasificación preconcebida, sólo tiene que esperar que su distribución coincida con el punto de vista de la mayoría de la gente. Pero ¿qué pasa con los clientes que no piensan de esa manera? Uno espera que pidan ayuda.

Sin embargo, con la evolución del comercio minorista online, ha llegado a ser evidente que poder recategorizar y reordenar los productos al instante revela su verdadero valor. Para empezar, la tiendas online pueden hacer listas de productos y categorizarlos en cuantas secciones elijan. Esto atrae la atención de los compradores potenciales que no habrían encontrado el producto en la categoría de partida, y también estimula la demanda en las personas que ni siquiera estaban buscando el producto, pero fueron inducidas a comprar mediante una ingeniosa colocación.

5 comentarios

La importancia del número de referencias en Google

Enrique Dans publicaba, en su columna de Libertad Digital, un artículo muy interesante sobre Ley de Impulso a la Sociedad de la Información (LISI), bajo el título La SGAE, la ley y Torquemada, y el subterfugio empleado por la SGAE para incluir un artículo polémico en el texto que debía pasar por el Consejo de Ministros. El revuelo levantando entre los Internautas y las empresas de telecomunicaciones provocó que finalmente fuese sido retirado, no sin algunos escepticismos sobre lo que realmente sucedería después y sobre la redacción del articulado.

En cualquier caso, y a pesar de la importancia que tiene esta ley para el futuro del funcionamiento de Internet y la Sociedad de la Información en España, no es el objetivo de este texto abordar este tema. De hecho, hoy queremos señalar el uso que se realiza de los resultados que devuelve Google ante una consulta para el refuerzo de una idea a la hora de defender una tesis. Así pues, pongamos el ejemplo del texto de Dans antes citado como ilustrativo:

Fray Tomás de Torquemada fue nombrado Inquisidor General por Isabel de Castilla y Fernando de Aragón en el año 1482. En su momento calificado de "martillo de herejes, luz de España, salvador de su país y honor de su orden", Torquemada y la Inquisición se convirtieron en el sinónimo de la crueldad, la tortura y el fanatismo al servicio de unas ideas. Nadie nunca tuvo tanto poder para, al margen de toda supervisión, imponer sus bárbaros criterios a toda una sociedad, algo que ha dejado una huella indeleble en la imagen de España en el mundo. La frase "nobody expects the Spanish Inquisition" tiene casi cien mil resultados en Google). […]

2 comentarios

Cambio de formato, cambio de nombre: del DOGV al DOCV

“Año nuevo, vida nueva”. Eso es al menos, lo que deben haber pensado las autoridades de la Comunidad Valenciana al esperar al cambio de año para hacer efectivo el cambio de nombre del boletín oficial de esta comunidad autónoma (“de ésta, nuestra comunidad”, si me permitís la broma).

Este cambio de denominación de “Diario Oficial de la Generalitat Valenciana” (DOGV) a “Diario Oficial de la Comunidad Valenciana” (DOCV), ha provocado la disconformidad del propio organismo jurídico consultivo de la Comunidad, ya que entra en conflicto con el recientemente aprobado Estatuto de Autonomía. Pero, a la mayoría, estas discrepancias políticas no nos preocupan demasiado y, para nosotros, seguramente seguirá siendo el “doj” (no hay otra forma de pronunciarlo); al igual que el DOUE (Diario Oficial de la Unión Europea), no ha dejado de ser el DOCE (Diario Oficial de la Comunidad Europea) para muchos.

Tengo que reconocer que el cambio de nombre, y su consiguiente polémica, me pasaron totalmente desapercibidos en su momento, seguramente debido a mi costumbre de leer ciertos artículos “en diagonal”, cuando anunciaron a bombo y platillo algo que me parecía mucho más importante: la desaparición del diario en su edición en papel. De momento, el Diario de Sesiones de los Plenos de Les Corts Valencianes va a seguir el mismo camino, respecto a la desaparición de su formato en papel, y ya veremos quién es el siguiente.

Pero no son las cuestiones semánticas ni menos las políticas las que quiero analizar aquí, sino los cambios más drásticos que ha sufrido este boletín oficial al comenzar el nuevo año ya con su versión digital definitiva.

6 comentarios

Google Patent Search versus USPTO Database

Cuando descubrí que Google había sacado un buscador de patentes, Google Patent Search, en vista de que tenía una búsqueda pendiente para el trabajo, decidí probar a ver cómo funcionaba antes de aventurarme en alguna de las bases de datos en las que suelo buscar.

Pero nada más empezar sufrí una decepción al comprobar que el buscador de patentes de Google sólo buscaba en la base de datos de la oficina de patentes de Estados Unidos (United States Patent and Trademark Office), la USPTO Patent Full-Text and Image Database  -aunque tratándose de una versión beta poco más nos podemos esperar-, ya que mi búsqueda abarcaba también patentes españolas, europeas y mundiales; pero de todas formas decidí comprobar su funcionalidad.

2 comentarios