Op deze website gebruiken we cookies om content en advertenties te personaliseren, om functies voor social media te bieden en om ons websiteverkeer te analyseren. Ook delen we informatie over uw gebruik van onze site met onze partners voor social media, adverteren en analyse. Deze partners kunnen deze gegevens combineren met andere informatie die u aan ze heeft verstrekt of die ze hebben verzameld op basis van uw gebruik van hun services. Meer informatie.

Akkoord

Vraag & Antwoord

Programmeren

HTML parsing in .NET

TCUSniper
4 antwoorden
  • Heeft iemand hier enige kennis van HTML parsing in VB.NET. Ik heb al heel wat afgegoogled, maar over .NET programmeren zijn over het algemeen niet veel tutorials te vinden. Kan iemand mij hierbij helpen of heeft iemand een goede tutorial voor mij?
  • Ik ben het niet met je eens, er is op internet zat informatie te vinden over het programmeren in .NET…

    Heb je op google al gezocht naar vb .net html parsing? Dan vind je een aantal interessante links:

    - CodeGuru: Parsing HTML without Using the Browser Control
    - HTML Parser For .NET C#, VB.Net

    CodeProject is ook een goeie site voor programmeervoorbeelden, zo vind je daar:

    - HTML Parsing using .NET Framework
    - WebResourceProvider VB.NET style

    Genoeg te vinden dus… :wink:
  • Het is allemaal net niet wat ik zoek. Waar ik naar opzoek ben is een manier van HTML Parsing waarbij ik bepaalde informatie van een webpagina kan plukken en kan plakken in een label.
    Het idee is om een RuneScape Client te maken, waarbij de speler door het intypen van zijn naam, zijn statistieken kan bekijken. Deze statistieken moeten vanuit deze pagina geparsed worden:
    http://hiscore.runescape.com/index_lite.ws?player=YourName

    voorbeeld:
    http://hiscore.runescape.com/index_lite.ws?player=Foxdoll

    De HTML Parser moet dit omzetten. Dus van iedere 3 delen, gescheiden met een komma een geheel maken. Dus Level, Experience en Rank. En deze weergeven in een label.
  • Voor zo'n simpele pagina is het eenvoudiger:

    1. Vraag de webpagina op in je VB .NET programma, voor een voorbeeld, zie hier. Als je dat voorbeeld gebruikt, dan zal je dus zelf iets toevoegen in de trant van: [code:1:ca73a9398b]Dim page As String = GetPage("http://hiscore.runescape.com/index_lite.ws?player=Foxdoll")
    Dim body As String = ExtractBody(page)[/code:1:ca73a9398b]

    2. Nu je de 'body' van de pagina in een string hebt, wat dus bestaat uit een lijst van telkens 3 cijfers, gescheiden door een komma, kan je met de string split functie de individuele waarden krijgen. Om eerst elke regel als aparte string in een array te krijgen, gebruik je:
    [code:1:ca73a9398b]Dim lines As String() = body.Split(Nothing)[/code:1:ca73a9398b]

    3. Om vervolgens in elke regel de kommagescheiden waarden te krijgen, kan je het volgende gebruiken: [code:1:ca73a9398b]For Each line As String In lines
    Dim values As String() = line.Split(',')
    ' Doe wat met je values
    Next line[/code:1:ca73a9398b]

    Dit zijn slechts codevoorbeelden, je moet ze uiteraard nog aanpassen naar jouw situatie.

Beantwoord deze vraag

Dit is een gearchiveerde pagina. Antwoorden is niet meer mogelijk.