Prompt (Claude 3.5 Sonnet 200K)
Dame el código para un script en RStudio que presente un campo inicial donde introducir una url y, tras analizar su contenido, compruebe los enlaces activos a otros documentos enlazados y dé la posibilidad de generar un resumen (con título, url, 5 ideas principales extraidas del contenido) de los documentos mostrados en una cheklist para seleccionar los enlaces relevantes (junto a la casilla de verificación debería aparecer el título de la página enlazada).
Prompt (Claude 3.5 Sonnet 200K)
Genera un script para RStudio (Título: Analizador de contenido) que permita llevar a cabo un proceso de web scrapping, es decir: extraer los enlaces contenidos en una url o en documentos html o pdf, locales o en línea, para explorar a continuación cada uno de esos recursos enlazados y extraer de cada uno el título, la url del documento enlazado y un resumen cuya extensión el usuario podrá configurar con barra deslizante, desde 5 líneas o ideas básicas hasta 15, elaboradas tras analizar las ideas centrales del documento enlazado (abstract, cuerpo principal, conclusión).
La interfaz debe ser visualmente atractiva a intuitiva. Mostrará un campo inicial donde pegar una url, con el botón "analizar" debajo.
Un segundo campo permitirá subir un fichero html, con el botón "analizar" debajo.
Un tercer campo permitirá ingresar una url de pdf, más la opción de subir un fichero pdf, con el botón "analizar pdf" debajo.
Este script debe proporcionar la funcionalidad de analizar con detalle el contenido de la url pegada o de los archivos html y pdf subidos, buscando enlaces activos a otros documentos que sirven de soporte al contenido (notas a pie, referencias o enlaces incrustados) y dé la posibilidad de generar un resumen (con título, url, y entre 5 y 15 líneas que resumirán las ideas principales, según solicite el usuario mediante barra deslizante).
La relación de enlaces extraídos de la url o documentos cargados debe mostrarse en una cheklist (deseleccionada, por defecto, pero con casilla superior para seleccionarlos todos), que permita al usuario seleccionar los enlaces relevantes (junto a la casilla de verificación debería aparecer directamente la url o enlace (doi, handle, o similar).
El resultado, tras explorar o analizar el contenido de los enlaces seleccionados y extraídas las ideas (5-15) de cada uno, a preferencia del usuario, debería mostrarse en un bloque de texto donde se va agregando el resumen de cada documento explorado, separando cada ítem con una línea.
El resultado (todo el bloque de texto, con los ítems separados por líneas) debe poder copiarse al portapapeles (asegura que esta funcionalidad está disponible al cargar el script en cualquier navegador) y también debe poder descargarse en formato markdown.
Si funciona, se subirá al servidor de shiny apps, lo que debes tener en cuenta a efectos de seguridad, acceso al portapapeles, etc.
Es importante darle un aspecto visualmente atractivo, intuitivo y máximamente funcional.
El ouput generado, en formato texto, debe estar estructurado con el título en una primera línea, la url asociada en una segunda línea, las ideas resumen en líneas sucesivas, y una línea de separación al finalizar. Los demás ítems se mostrarán a continuación, con la misma estructura.
El resumen o contenido extraído no debe incluir partes del código html o xml del documento diana, ni enlaces a redes sociales o ads; solo ideas que resuman o sinteticen bien su contenido.
→