PHP сообщество

любители кода :)

Выделение блоков в html

Bloged in Без рубрики от admin Суббота Январь 5, 2008 at about 6:47 дп

Есть массив, элементы которого - html текст. Все элементы имеют одну и ту же структуру.
Задача - наиболее оптимальным способом выцепить из этих элементов куски.

Поясню. Например элемент представляет из себя что-то вроде:

    <td>текст1</td></td></td>
    <div>текст2</div></td>
    <a href=”">ссылка1</a>

Заранее структура элемента не известна, и требуется получить на выходе текст1, текст2, ссылка1. Элемент может содержать “шумы”, т.е. структура не обязательно правильно оформлена - например это появление двух лишних </td></td> после текст1

Как лучше всего это сделать? Может с DOM напрямую работать, оттуда проще будет выцепить?
Мб есть готовые функции на php для разбора структуры?

UPD: текст1, текст2 совершенно произвольный и может в ключать в себя html код. Например, первые два элемента массива могут быть просто текстом, тогда как третий элемент будет содержать табличку. Общая структура элемента при этом останется неизменной, а вот “формат” текста1 будет разным.

UPD1: Реализована промежуточная версия, которая генерирует фиды, скачивая каждый пост из френдленты. С кэшированием.

Комментариев нет

Комментариев нет.

Извините, комментирование на данный момент закрыто.