help_conquer_ca (original) (raw)

Обновление от сентября 2011

Новая веха

На 1 октября 2011 года было обработано и получено 204 067 016 результатов расчетных заданий. Спасибо Вам всем за вашу постоянную поддержку и вклад – в среднем по 54 года процессорного времени за день.

Мы уже заканчиваем подготовку проекта- Help Conquer Cancer II (Помогите победит рак II) - фокусирующего внимание на систематической идентификации молекулярных маркеров, что позволит в свою очередь улучшить раннюю диагностику и выявлять большее количество разновидностей рака.

Бета-версия GPU-приложения HCC

Мы разработали GPU версию приложения для автоматического анализа изображения и классификации систем кристаллизации белков с изображений из Hauptman Woodward Institute’s High-Throughput Screening lab. Стадия анализа одного изображения включает вычисление 12375 численных функций. Исходя из этого, мы научили анализатор классифицировать 11 различных типов кристаллизации. Анализатор распознает 80% кристаллов, 94% чистых веществ, 94% осадков.

Мы сосредоточили наши усилия на оптимизации GLCM функций, которые потребляют 98% времени выполнения задания в процессорной версии приложения. Так же, исходя из поддержки OpenCL 1.0 несколькими поставщиками (вендорами) и типами устройств, мы выбрали именно этот язык программирования.

Чтобы подготовиться к перспективе работы в WCG, мы рассмотрели реализацию на картах NVIDIA и ATI в Linux и Mac OS. Теоретически, программа, написанная в соответствии со спецификациями API OpenCL должна корректно работать на всех поддерживающих OpenCL устройствах. Очевидно, что это не гарантирует оптимальной производительности из-за различия в аппаратных архитектурах. По этим причинам мы написали отдельные версии кода для процессоров, NVIDIA и ATI карт.

Результаты удивляют. Время выполнения процессором Intel Xeon (1 поток) в среднем 4092 секунд, и всего 65 секунд на NVIDIA Tesla C2050.

Нам удалось добиться значительного увеличения производительности для данной задачи. В итоге наш окончательный вариант OpenCL кода выполняется от 6 до 60 раз быстрее по сравнению с оригинальным оптимизированным C + + кодом. Необходимо более 3 дней процессорного времени для обработки нашего маленького тестового набора, состоящего из 50 изображений, и всего лишь 2 часа на NVIDIA Tesla C2050 GPU.

Всегда существует компромисс между точностью и производительностью. Сначала мы вычислили относительную ошибку OpenCL по сравнению с версией процессора. Тем не менее, нам не достаточно лишь повышения производительности - нам так же нужна высокая точность результатов. Чтобы оценить наш код реализованный на OpenCL мы использовали существующий оптимизированный C + + код, который используется на World Community Grid. Почти 97% от всех значений верны до четырех значащих цифр. В конечном счете, самое важное для нас заключается в том, что бы влияние потери точности не сказалось негативно на анализаторе типов кристаллизации. Чтобы убедиться, что все результаты, которые мы получаем в OpenCL версии, не повлияют на нашу классификацию, мы протестировали окончательный код на наборе из 4500 изображений. Затем мы применили наш анализатор типов как для GPU и CPU- версий приложения и в итоге нашли только восемь изображений, которым были присвоены различные типы. Все восемь этих образцов принадлежали неоднозначной категории (эксперты не согласились на истинный тип изображений), предполагая, что расхождения между результатами GPU и ЦП версий не представляют никакой проблемы.

Версия GPU работает настолько быстро, что позволяет в тот же день проанализировать изображение кристаллизации, кроме того она способна корректно работать параллельно с процессорной версией World Community Grid. В ближайшем будущем мы рассчитываем ввести GPU версию Help Conquer Cancer в стадию бета-тестирования.

Прочие достижения.

Прочие достижение в нашем исследовании это вновь запущенный веб-сайт The Cancer Gene Encyclopedia (Энциклопедия генов рака): http://ophid.utoronto.ca/cgep . Так же мы выпустили первую версию нашего портала микроРНК: цель которого предсказание - mirDIP - http://ophid.utoronto.ca/mirDIP.

Недавно мы объединились с доктором Dr. J.Dick и благодаря совместному исследованию определили признак стволовых клеток помогающий спрогнозировать степень заболевания лейкемией:

Eppert, K., Takenaka, K., Lechman, E.R., Waldron, L., Nilsson, B., van Galen, P., Metzeler, K., Poeppl, A., Ling, V., Beyene, J., Canty, A.J., Danska, J.S., Bohlander, S.K., Buske, C., Minden, M.D., Golub, T.R., Jurisica, I., Ebert, B.L., Dick, J.E. Stem cell gene expression programs influence clinical outcome in human leukemia, Nat Medicine, 14(8): 822–827, 2011. (Признак стволовых клеток и его влияние на клинические результаты болеющих лейкемией. Национальная медицина. (Журнал такой))

Еще один интересный результат это исследование опухолей головы и шеи, которое позволит существенно изменить процесс лечения пациентов. Оно было опубликовано в выпуске BMC:

A genesignature in histologically normal surgical margins is predictive of oral carcinoma recurrence. Reis, P.P., Waldron, L., Perez-Ordonez, B., Pintilie, M., Natalie Galloni, N., Xuan, Y., Cervigne, N.K., Warner, G.C., Makitie, A.A., Simpson, C., Goldstein, D., Brown, D., Gilbert, R., Gullane, P., Irish, J., Jurisica, I., and Kamel-Reid, S., BMC Cancer, 2011. In press.

Список других публикаций можно найти на http://www.cs.utoronto.ca/~juris/publications.htm.

А для тех, кто любит кататься на велосипеде – мы завершили наш 4-ый выезд для борьбы с раком в Онтарио и первый подобный в Квебеке. Пожалуйста найдите возможность присоединиться к нам и поддержать наши исследования. Еще больше информации вы можете найти на http://www.cs.toronto.edu/~juris/gallery.htm.

Спасибо вам

C. A. Cumbaa, Yulia Kotseruba and I. Jurisica

Автор перевода - Alexonee