Я так понял, вопрос сошелся к тому, из чего и произошел: стоит ли писать асмовый код системных функций руками или компилятор сделает все быстрее и лучше?
Мое имхо - стоит.
1. мля... е мае.... ЗАЧЕМ??? то что написано будет МЕДЛЕННЕЕ чем сгенерит кампилятор - факт
2. Зачем утяжелять узкое место, а?...
3. если таки найдется специалист по всем 3dnow то давайте подщитаем
надо написать код оптимизированы под ~5 архитектур хотя бы самые основные (от i386 до amd64)
для написание такого кода понадобится x3 программиста. прирост ТЕОРЕТИЧЕСКИЙ (не практический) 10%, а ЗАРПЛАТА уменьшится в 3 раза.
4. я уже не говорю что есть спецы по asm-у например в радиусе 100километров от Гродно
5. что за привычка оптимизировать что не попадя?
Нет ничего хуже чем преждевременная опцимизация © Кнут
6. я УВЕРЕН что твои app будут тормазить не потому что функции медленные, а потому что ты массив будеш сортировать пузырьком (пример грубой, но достаточно показательный)
7. неужели так ТРУДНО понять что счас в основном главное ето СКОРОСТЬ разработки, именно поетому НЕ кампилируемые языки шагают по миру...