Uso de expresiones regulares, ¿cómo es la forma más sencilla de buscar una web HTML y encontrar el valor dentro de esta etiqueta (o el valor de cualquier atributo para el caso): [] Snip NAME="GENERATOR" [] Snip Respuesta 1 Depende de cómo sofisticados de una petición HTTP que necesita para construir (autenticación, etc.) He aquí una forma sencilla que he visto utilizado en el pasado. StringBuilder html = new StringBuilder (); url = java.net.URL nueva URL ("http://www.google.com/"; BufferedReader entrada = null; try ( nueva entrada BufferedReader ( nueva InputStreamReader (())); url.openStream String htmlLine; while ((= htmlLine input.readLine ())!= null) ( html.appendLine (htmlLine); ) ) finally ( entrada.close (); ) exp = Patrón Pattern.compile ( ""; Matcher Matcher = exp.matcher (html.toString ()); if (matcher.find ()) ( System.out.println ("Generador:" + matcher.group (1)); ) Es probable que un montón de errores que aquí se encuentra una vez recopilados. (Espero que esto no fue tarea) Respuesta 2 Usted debe estar utilizando la consulta XPath. It'ls tan simple como conseguir el valor de "/ html / cabeza / [meta @ nombre] = generador /" valor @. una buena tutorial Respuesta 3 Es posible que desee comprobar la documentación para el paquete org.apache.commons.HttpClient Apache y los paquetes relacionados aquí. El envío de una solicitud HTTP de una aplicación Java es bastante fácil de hacer. Meter el dedo a través de la documentación deberá bajar en la dirección correcta. Respuesta 4 No he probado esto, pero no el marco básico se 1.Abrir una java.net.HttpURLConnection 2.Obtener un flujo de entrada utilizando getInputStream 3.Usar la expresión regular en respuesta de Mike para analizar el fragmento que desee Respuesta 5 En sentido estricto no se puede realmente estar seguro de que tienes el valor correcto, ya que la etiqueta meta puede ser comentada, o en la etiqueta meta puede estar en mayúsculas, etc Depende de lo seguro que es que el HTML se puede considerar como "buena ". Respuesta 6 Depende. Si está extrayendo información de un sitio o sitios que están garantizados para estar bien formados HTML, y usted sabe que el no será ofuscado de alguna manera a continuación, una lectura de la línea de sección por línea y la aplicación de un regex es un buen enfoque. Por otra parte, si el código HTML puede ser mutilado o "complicado", entonces usted necesita utilizar un buen programa de análisis de HTML, posiblemente una permisiva como un HTMLTidy. Tenga cuidado de usar una estricta HTML o XML parser en cosas de arrastre de las páginas web al azar. Muchos de los llamados HTML que puedes encontrar por ahí es realmente incorrecto. Fuente: Rápida manera de encontrar un valor en formato HTML (Java)
Rápida manera de encontrar un valor en formato HTML (Java)
Datos archivados del Taringa! original
0puntos
44visitas
0comentarios
Actividad nueva en Posteamelo
0puntos
0visitas
0comentarios
Dar puntos:
Posts Relacionados
Xbox se ríe de la falta de retrocompatibilidad de PS4ZerinysElVerdugo
0
archivado0
archivado0
archivado0
archivadoDejá tu comentario
No hay comentarios nuevos todavía