Нашел на Хабре:

По просьбам некоторых читателей моих предыдущих статей, я протестировал четыре библиотеки для парсинга HTML-кода:
  • «PHPQuery»
  • «Simple HTML DOM»
  • «Zend DOM Query»
  • «Nokogiri»
Нужно учитывать, что часто HTML-код является невалидным, по-этому для сравнения выбирались только библиотеки, умеющие работать с не валидным кодом.Лучшая библиотека выбиралась из таких критериев как:
  • Скорость
  • Документация
  • Удобство
  • Надёжность

Познавательно. Давно хотел спарсить несколько сайтов для своих нужд. Нашел инструменты :)