Кто-нибудь ещё читает research!rsc? Как и предупреждалось, обновляется действительно спорадически. Вчера появилась новая статья — о подходе к решению проблем, связанных с неатомарностью операций записи в Go. Просмотрел вскользь перед сном. А сегодня решил почитать более обстоятельно — вместо неё статья о Yacc. Старая статья быля мне интереснее, хотя и небесспорная.
Из новой статьи, цитата:
regular expressions are `WYSIWYG'—the language described is the language that gets matched—whereas parser-generators are WYSIWYGIYULR(k)—`what you see is what you get if you understand LR(k).'
no subject
Date: 2010-12-06 10:10 pm (UTC)... И на кошек ноль внимания - вот это воспитание! ...
no subject
Date: 2010-12-07 07:48 am (UTC)Да, меня тоже удивило противопоставление re и yacc. Это же совершенно разные вещи. Но злоупотребления регэкспами я вижу — попытки обработки html и xml (если это не одноразовый скрипт).
Сам я тоже не без греха. Когда-то в скриптах по чистке fb2 использовал именно набор головоломных регэкспов. Так короче, быстрее (я прогонял гигабайты), проще. Xml перед обработкой канонизировал, чтобы не было сюрпризов. И совсем недавно делал в одной программе подсветку синтаксиса JavaScript: строки и комментарии парсил вручную (регэкспами это не сделать, а так элементарный автомат), а ключевые слова и числа между ними — регэкспами.