Если html файл соответствует стандарту xhtml, то "относительно" просто парсить через то же MSXML.
Если же нет - либо мучится с 'Microsoft HTML Object Library'.HTMLDocument и ограничением в 1000 символов, либо написать обработчик на java script: разбирать документ и кидать в базу через ADO.
|