Для себя я как-то решил, что в таких программных лукапах, где есть группировка, использовать временные таблицы (конечно, в 2012 те, что TempDB) или вьюхи.
Конечно, можно программно заткнуть описанные в теме проблемы, но практически любое их таких решений выключает возможности хоть как-то влиять на скорострельность.
В общем, что-то сделано, вроде работает, но как оптимизировать скорость работы таких частичных "затычек" непонятно в принципе.
|