Выделение блоков в html
Есть массив, элементы которого - html текст. Все элементы имеют одну и ту же структуру.
Задача - наиболее оптимальным способом выцепить из этих элементов куски.
Поясню. Например элемент представляет из себя что-то вроде:
- <td>текст1</td></td></td>
<div>текст2</div></td>
<a href=”">ссылка1</a>
Заранее структура элемента не известна, и требуется получить на выходе текст1, текст2, ссылка1. Элемент может содержать “шумы”, т.е. структура не обязательно правильно оформлена - например это появление двух лишних </td></td> после текст1
Как лучше всего это сделать? Может с DOM напрямую работать, оттуда проще будет выцепить?
Мб есть готовые функции на php для разбора структуры?
UPD: текст1, текст2 совершенно произвольный и может в ключать в себя html код. Например, первые два элемента массива могут быть просто текстом, тогда как третий элемент будет содержать табличку. Общая структура элемента при этом останется неизменной, а вот “формат” текста1 будет разным.
UPD1: Реализована промежуточная версия, которая генерирует фиды, скачивая каждый пост из френдленты. С кэшированием.
Комментариев нет
Комментариев нет.
Извините, комментирование на данный момент закрыто.