Rápida manera de encontrar un valor en formato HTML (Java)

Info•6/16/2010

#rapida #java #buena #encontrar #sencilla #camino #html #contestar #el valor #de entrada html #encontrar la línea #stringbuilder

Uso de expresiones regulares, ¿cómo es la forma más sencilla de buscar una web HTML y encontrar el valor dentro de esta etiqueta (o el valor de cualquier atributo para el caso): [] Snip NAME="GENERATOR" [] Snip Respuesta 1 Depende de cómo sofisticados de una petición HTTP que necesita para construir (autenticación, etc.) He aquí una forma sencilla que he visto utilizado en el pasado. StringBuilder html = new StringBuilder (); url = java.net.URL nueva URL ("http://www.google.com/"; BufferedReader entrada = null; try ( nueva entrada BufferedReader ( nueva InputStreamReader (())); url.openStream String htmlLine; while ((= htmlLine input.readLine ())!= null) ( html.appendLine (htmlLine); ) ) finally ( entrada.close (); ) exp = Patrón Pattern.compile ( ""; Matcher Matcher = exp.matcher (html.toString ()); if (matcher.find ()) ( System.out.println ("Generador:" + matcher.group (1)); ) Es probable que un montón de errores que aquí se encuentra una vez recopilados. (Espero que esto no fue tarea) Respuesta 2 Usted debe estar utilizando la consulta XPath. It'ls tan simple como conseguir el valor de "/ html / cabeza / [meta @ nombre] = generador /" valor @. una buena tutorial Respuesta 3 Es posible que desee comprobar la documentación para el paquete org.apache.commons.HttpClient Apache y los paquetes relacionados aquí. El envío de una solicitud HTTP de una aplicación Java es bastante fácil de hacer. Meter el dedo a través de la documentación deberá bajar en la dirección correcta. Respuesta 4 No he probado esto, pero no el marco básico se 1.Abrir una java.net.HttpURLConnection 2.Obtener un flujo de entrada utilizando getInputStream 3.Usar la expresión regular en respuesta de Mike para analizar el fragmento que desee Respuesta 5 En sentido estricto no se puede realmente estar seguro de que tienes el valor correcto, ya que la etiqueta meta puede ser comentada, o en la etiqueta meta puede estar en mayúsculas, etc Depende de lo seguro que es que el HTML se puede considerar como "buena ". Respuesta 6 Depende. Si está extrayendo información de un sitio o sitios que están garantizados para estar bien formados HTML, y usted sabe que el no será ofuscado de alguna manera a continuación, una lectura de la línea de sección por línea y la aplicación de un regex es un buen enfoque. Por otra parte, si el código HTML puede ser mutilado o "complicado", entonces usted necesita utilizar un buen programa de análisis de HTML, posiblemente una permisiva como un HTMLTidy. Tenga cuidado de usar una estricta HTML o XML parser en cosas de arrastre de las páginas web al azar. Muchos de los llamados HTML que puedes encontrar por ahí es realmente incorrecto. Fuente: Rápida manera de encontrar un valor en formato HTML (Java)

Datos archivados del Taringa! original

0puntos

44visitas

0comentarios

Actividad nueva en Posteamelo

0puntos

0visitas

0comentarios

Dar puntos:

Posts Relacionados

Xbox se ríe de la falta de retrocompatibilidad de PS4ZerinysElVerdugo

0

archivado

Intel anuncia oficialmente el Core i7-2700Kbenizhan

0

archivado

Trucos para perder la timidez al hablar inglésANTRUCK

0

archivado

Reducir el tamaño de tus vcd o cvcdbola8

0

archivado

Rápida manera de encontrar un valor en formato HTML (Java)

Posts Relacionados

Dejá tu comentario

Autor del Post