Чтение html-страницы и вставка ее в базу данных с использованием классического asp

Я пытаюсь прочитать html-страницу (файл), включая ее теги, построчно, а затем вставить ее в базу данных с помощью классического ASP. Моя проблема в том, что я не могу читать html-теги Like

    <p>Test</p>

or

    <td width="20%">Hello</td>

вместо этого я читаю «Тест» или «Привет». Я также знаю, что мне нужно преобразовать " в ", когда я должен его заменить? Вот мой код чтения:

        Dim url,strArr,xmlhttp,lineno
        url = "http://localhost/0/questions/q.html"
        set xmlhttp = CreateObject("MSXML2.ServerXMLHTTP")            
        xmlhttp.open "GET", url, false
        xmlhttp.send ""
        strArr = split(xmlhttp.responseText,vbcrlf)
        set xmlhttp = nothing
        for lineno=0 to ubound(strArr)
           ' Here I do replacement, parsing and then insertion to database
        next

person user3532287    schedule 14.04.2014    source источник
comment
Ваш код работает как есть, и я не знаю, о чем вы спрашиваете. Скорее всего, вы ошибаетесь где-то еще. Я только что получил исходный код HTML для этой конкретной страницы и без проблем записал его в базу данных, используя ваш код и мое соединение с БД. Покажи код, где именно делаешь и потом увидишь, что ответит. пиши привет.   -  person All Blond    schedule 14.04.2014
comment
мы здесь для развлечения, но было бы неплохо, если бы вы отметили то, что вам помогло, как ответ, а не просто проголосовали.   -  person All Blond    schedule 16.04.2014


Ответы (2)


Попробуй это:

 Dim url,strArr,xmlhttp,lineno
    url = "http://localhost/0/questions/q.html"
    set xmlhttp = CreateObject("MSXML2.ServerXMLHTTP")            
    xmlhttp.open "GET", url, false
    xmlhttp.send ""
    strArr = split(xmlhttp.responseText,vbcrlf)
    set xmlhttp = nothing
    for lineno=0 to ubound(strArr)
      response.write(Replace(strArr(lineno),"<","<'"))
    next

Если вы разместили на своей странице только response.write(strArr(lineno)) , вы увидите только то, что находится внутри тега html, а не сам тег. Но если вы вставите этот strArr(lineno) в базу данных, все будет там. Пока вы замените все апострофы.

person All Blond    schedule 14.04.2014

Попробуйте использовать responseHTML вместо responseText:

strArr = split(xmlhttp.responseHTML,vbcrlf)
person kloarubeek    schedule 14.04.2014