digger писал(а):Т.е. именно реализовать алгоритм прямыми руками без багов и эксплоитов?
Там обычно речь идет об алгоритмах, которые определяют версию процессора, размер кэша и выдаивают из системы последние тики. Как правило, подобные алгоритмы пишутся на ~20%-30% на ассемблере или на интринсиках процессора, что, в принципе, одно и то же.
Люди, которые так работают, это вишенка на сливках. Лично я эту работу не перевариваю. Последняя стадия отладки - симуляторы форм сигнала на шинах процессора. Нужно добиться, чтобы сумма промежутков между сигналами были не более 5%-8% времени работы функции (кэрнэла алгоритма).
Есть у меня на работе одна женщина, "русская", которая без ума от этой работы. Она может часами сидеть перед симулятором сигнала и выискивать там, где ещё можно тик-два выдоить. Потом высчитывает тики, чтобы найти то место в функции, где можно улучшить. Брррр.