Расшифровка мади: Московский автомобильно-дорожный государственный технический университет

Содержание

Расшифровка имени Мади по буквам имени

  1. Значение имен
  2. Популярные имена
  3. буквы имени Мади

Анализ по количеству букв в имени

Имена из четырех букв говорят о наличии ума аналитического склада. Этих мужчин прежде всего интересует практический потенциал любой идеи. Поэтому основное внимание они уделяют вопросу целесообразности каждого действия. Внешний облик соответствующий: ни длинных волос, ни «умопомрачительных» нарядов. Предпочтение отдается спортивному стилю. К вопросу о создании семью подходят так же серьезно и взвешенно, как и ко всему остальному.

Интерпретация значений каждой из букв имени

м

Человеколюбие, способность мириться с чужими недостатками, любопытство по отношению ко всему новому в любом возрасте. Заботливы, но без навязчивости. Обаятельны.

а

Точка отсчета, символ целенаправленной активности. Стремление к физическому и духовному совершенствованию делает людей, чье имя начинается с этой буквы, инициативными созидателями в той области, которую они выбирают. Это – лидеры во всех отношениях.

д

Люди, часто совершающие ошибки, но редко склонные их признавать. Чувство меры постоянно конфликтует с порывистостью, недостаточной осмотрительностью. Романтичны, обаятельны, незакомплексованы.

и

Эта буква в имени является показателем одухотворенности, тонкого чувства гармонии, природного изящества. Это проявляется не только в заботе о своем внешнем облике и антураже, но и в образе мышления. Отсюда – здоровый скептицизм, честность, прямота, что далеко не всегда нравится их партнерам. В результате: либо частые разводы, либо множество связей «без взаимных обязательств».

Узнать больше об имени Мади

Расшифровка имени Мади по буквам имени

  1. Значение имен
  2. Популярные имена
  3. буквы имени Мади

Анализ по количеству букв в имени

Имена из четырех букв говорят о наличии ума аналитического склада. Этих мужчин прежде всего интересует практический потенциал любой идеи. Поэтому основное внимание они уделяют вопросу целесообразности каждого действия. Внешний облик соответствующий: ни длинных волос, ни «умопомрачительных» нарядов. Предпочтение отдается спортивному стилю. К вопросу о создании семью подходят так же серьезно и взвешенно, как и ко всему остальному.

Интерпретация значений каждой из букв имени

м

Человеколюбие, способность мириться с чужими недостатками, любопытство по отношению ко всему новому в любом возрасте. Заботливы, но без навязчивости. Обаятельны.

а

Точка отсчета, символ целенаправленной активности. Стремление к физическому и духовному совершенствованию делает людей, чье имя начинается с этой буквы, инициативными созидателями в той области, которую они выбирают. Это – лидеры во всех отношениях.

д

Люди, часто совершающие ошибки, но редко склонные их признавать. Чувство меры постоянно конфликтует с порывистостью, недостаточной осмотрительностью. Романтичны, обаятельны, незакомплексованы.

и

Эта буква в имени является показателем одухотворенности, тонкого чувства гармонии, природного изящества. Это проявляется не только в заботе о своем внешнем облике и антураже, но и в образе мышления. Отсюда – здоровый скептицизм, честность, прямота, что далеко не всегда нравится их партнерам. В результате: либо частые разводы, либо множество связей «без взаимных обязательств».

Узнать больше об имени Мади

ООО МАЛОЕ ИННОВАЦИОННОЕ ПРЕДПРИЯТИЕ НАУЧНО-ИНЖЕНЕРНЫЙ ЦЕНТР МОСТОВ И СООРУЖЕНИЙ — ОГРН 5167746508485, ИНН 7714966995

Действует Обновлено 01.10.2021

Компания ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ «МАЛОЕ ИННОВАЦИОННОЕ ПРЕДПРИЯТИЕ «НАУЧНО-ИНЖЕНЕРНЫЙ ЦЕНТР МОСТОВ И СООРУЖЕНИЙ» зарегистрирована 30.12.2016 г. Краткое наименование: МАЛОЕ ИННОВАЦИОННОЕ ПРЕДПРИЯТИЕ НАУЧНО-ИНЖЕНЕРНЫЙ ЦЕНТР МОСТОВ И СООРУЖЕНИЙ. При регистрации организации присвоен ОГРН 5167746508485, ИНН 7714966995 и КПП 771401001. Юридический адрес: ГОРОД МОСКВА ПРОСПЕКТ ЛЕНИНГРАДСКИЙ ДОМ 64.

Валиев Шерали Назаралиевич является генеральным директором организации. Учредители компании — ВАЛИЕВ ШЕРАЛИ НАЗАРАЛИЕВИЧ, ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «МОСКОВСКИЙ АВТОМОБИЛЬНО-ДОРОЖНЫЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ (МАДИ)», ВАСИЛЬЕВ ЮРИЙ ЭММАНУИЛОВИЧ. Среднесписочная численность (ССЧ) работников организации — 4.

В соответствии с данными ЕГРЮЛ, основной вид деятельности компании ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ «МАЛОЕ ИННОВАЦИОННОЕ ПРЕДПРИЯТИЕ «НАУЧНО-ИНЖЕНЕРНЫЙ ЦЕНТР МОСТОВ И СООРУЖЕНИЙ» по ОКВЭД: 71.12 Деятельность в области инженерных изысканий, инженерно-технического проектирования, управления проектами строительства, выполнения строительного контроля и авторского надзора, предоставление технических консультаций в этих областях. Общее количество направлений деятельности — 5.

За 2020 год прибыль компании составляет — 8 513 000 ₽, выручка за 2020 год — 62 706 000 ₽. Размер уставного капитала ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ «МАЛОЕ ИННОВАЦИОННОЕ ПРЕДПРИЯТИЕ «НАУЧНО-ИНЖЕНЕРНЫЙ ЦЕНТР МОСТОВ И СООРУЖЕНИЙ» — 41 429 ₽. Выручка на начало 2020 года составила 38 316 000 ₽, на конец — 62 706 000 ₽. Себестоимость продаж за 2020 год — 51 783 000 ₽.

На 15 октября 2021 организация действует.

Юридический адрес МАЛОЕ ИННОВАЦИОННОЕ ПРЕДПРИЯТИЕ НАУЧНО-ИНЖЕНЕРНЫЙ ЦЕНТР МОСТОВ И СООРУЖЕНИЙ, выписка ЕГРЮЛ, аналитические данные и бухгалтерская отчетность организации доступны в системе.

Список компаний ЮЛ (юридических лиц) г Рузаевка с кодом ОКВЕД 42.11

Предприниматель в г Рузаевка при регистрации ООО или когда решает, что Респу́блика Мордо́вия — лучшее место, чтобы открыть ИП должен принять решение, какой ОКВЭД назначить организации при регистрации компании в регионе.

Код ОКВЭД 42.11 имеет расшифровку Строительство автомобильных дорог и автомагистралей и позволяет назначить этот ОКВЭД как основной вид деятельности, или как дополнительный код экономической деятельности вновь создаваемой организации.

Как показывает данные нашего реестра Выписка Налог, уже 4 компании в г Рузаевка имеют данный вид деятельности в своем реестре. Это значит, что данный общероссийский код экономической деятельности (ОКВЭД 42.11) востребован всеми типами предпринимателей в регионе Респу́блика Мордо́вия — и обществами с ограниченной ответственностью и индивидуальными предпринимателями.

В нашем сервисе Вы можете как ознакомиться в этими организациями малого и среднего предпринимательства (МСП), так и заказать регистрацию организации в специализированном разделе сервиса. Среди популярных организаций с ОКВЭД 42.11 часто запрашиваются ООО «МАДИ», МП МО РУЗАЕВКА «ДОРОЖНИК», ООО «РУЗАВТОСТРОЙ», ООО «РУЗДОРСТРОЙ»,

Напоминаем, что наш портал Vypiska-Nalog и его реестр компаний подразумевает помощь не только при организации нового юридического лица, но и позволяет сделать предоставление данных о уже действующих компаниях, содержащихся в ЕГРЮЛ/ЕГРИП г Рузаевка сведений в форме электронного документа в режиме онлайн. Это позволяет проверить достоверность, стабильность или реквизиты компании, попавшие в реестр ФНС при регистрации. Функционал доступен при переходе на карточку организации ниже.


Всего организаций с ОКВЭД 42.11 в базе:

16393

Актуальность базы фирм: 2021-10-12

Компаний в реестре г Рузаевка с этим ОКВЭД: 4

Текущая дата: 2021-10-15

Моделирование приборной панели автомобиля Honda CRV в среде LabVIEW 2015

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО
ОБРАЗОВАНИЯ «МОСКОВСКИЙ АВТОМОБИЛЬНО-ДОРОЖНЫЙ ГОСУДАРСТВЕННЫЙ
ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ (МАДИ)»
ИНТЕРФЕЙСЫ АВТОМАТИЗИРОВАННЫХ СИСТЕМ
ОБРАБОТКИ ИНФОРМАЦИИ И УПРАВЛЕНИЯ (ИАСОиУ)
Курсовая работа по теме:
«Моделирование приборной панели автомобиля
Honda CRV в среде LabVIEW 2015»
Выполнил: студент группы 3ЗБАСс2
Ляпкин Павел Николаевич
Проверил: д. т.н., профессор
Остроух Андрей Владимирович
МОСКВА 2017
Характеристики
Тип кузова: Внедорожник
Тип двигателя: Бензин
Модель двигателя: R20A9 I-VTEC
Мощность: 158 л.с.
Тип КПП: автоматическая
Максимальная скорость: 220 км/час
Объем топливного бака: 58 л.
Салон
Обивка салона: кожа
Цвет салона: темный
Электропривод зеркал
Стеклоподъемники:
электро
Сиденье водителя:
ручная регулировка
по высоте
Сиденье пассажира:
ручная регулировка по
высоте
Кондиционер
Общий вид приборной панели
Тахометр (разметка
0-8 тыс. об/мин, красная
зона 7-8)
Температура
двигателя
Спидометр
(в километрах в час)
Ёмкость топливного
бака (60 л)
Block Diagram приборной панели в LabVIEW
На данной блок диаграмме показан пробег автомобиля и
количество оставшегося топлива в бензобаке, а так же датчик
низкого уровня топлива. При расчёте использовались значения,
получаемые со спидометра, объём бака в литрах и расход бензина
на 100 километров пути.

Управление сигналом аварийной остановки,
поворотниками, габаритными огнями, ближним и
дальним светом фар (работают только при
включенных габаритных огнях), ручным тормозом.
Для реализации данной Блок диаграммы
потребовались следующие элементы:
— Square LED,
— Square push button, — not or,
— Blinking,
— Not,
switch
— Horizontal pointner slide,
— Square Light,
— Vertical toggle
— While loop
На данной блок диаграмме
показана работа спидометра и
тахометра.
По
средством
элемента Case structure создается
каждая отдельная передача. В
каждой Case structure находятся
еще два case один из которых
отвечает за управление сигналом
той передачи которая включена, а
другой отвечает за скорость на
датчике спидометра. На данной
марке автомобиля стоит АКПП,
следовательно
количество
передач равно четырем. На блок
диаграмме получается четыре
элемента Case Structure.
Общий вид приборной панели,
разработанной в среде LabView.
При повороте ключа зажигания в положение один становится возможным
включение ближнего и дальнего света фар, а так же на электронном табло
загорается выбранная в данный передача АКПП.
При нахождении ключа
зажигания в положение
два двигатель включен.
Становится
возможным
включение света фар, а так
же на электронном табло
загорается выбранная в
данный передача АКПП.
Автомобиль
начинает
движение и происходит
насчет километража.
При подходе к определенному значению пробега в автомобиле заменяется
аккумулятор и масло, подходя к этой отметке загораются соответствующие
индикаторы
При подходе уровня топлива в баке к критической отметке
загорается соответствующий индикатор.

13. Список литературы:

1. Джеффри Тревис – LabVIEW для всех.
2. LabVIEW руководство пользователя.
3. К.Е. Климентьев – Основы графического
программирования в среде LABVIEW.
4. LABVIEW 8.20 Справочник по функциям.

Словарь дорожно-транспортных аббревиатур — Борьба с заторами в Москве и области — LiveJournal

В кругу специалистов или любителей со стажем многие длинные термины сокращают до нескольких букв, понятных без перевода любому собеседнику. Есть такой профессиональный сленг и в дорожно-транспортной среде. Если вам случалось сталкиваться с незнакомыми сокращениями, этот дайджест может пригодиться. Термины в каждом разделе по алфавиту. Кое-где даны пояснения, которые позволяет не только расшифровать аббревиатуру, но и понять смысл. В разделе по органам власти приведены ссылки на сайты.

Разное
АСКП — автоматизированная система контроля проезда («турникеты»)
АСУДД — автоматизированная система управления дорожным движением
ВП — выделенная полоса для общественного транспорта
ВПУ – выносной пульт управления (закрытая на ключ панель с кнопками ручного управления светофором для инспектора ГИБДД)
ГСМ – горюче-смазочные материалы (солярка, бензин, масла и т. д.)
ДК — дорожный контроллер (серый шкаф возле светофорного объекта, который управляет им)
ДТ — детектор транспорта
ЖМ — желтый мигающий режим светофора
ИДН, ИН — искусственная дорожная неровность («лежачий полицейский»)
ИТС — интеллектуальная транспортная система
КУ — координированное управление светофорами
ЛТ — личный транспорт
МАФ — малые архитектурные формы (вазы, небольшие клумбы, кадки, лавочки и т.д.)
МБО — металлическое барьерное ограждение
НГПТ — наземный городское пассажирский транспорт
НОТ — наземный общественный транспорт
ОДХ — объект дорожного хозяйства
ООТ — остановка общественного транспорта
ОРП — отстойно-разворотная площадка (место стоянки автобусов, троллейбусов и маршруток, но не парк)
ОТ — общественный транспорт
ОХ — основной ход (главная проезжая часть дороги, не боковой проезд)
ПГС — песко-гравийная смесь
ПДС — поезда дальнего следования
ПП — пешеходный переход либо перехватывающая парковка
ПС – подвижной состав
ПСП – переходно-скоростная полоса
ПЧ — проезжая часть
СО — светофорный объект (все светофоры, управляемые одним контроллером)
СТ — скоростной трамвай
ТВП — табло вызывное пешеходное («кнопка для пешеходов»)
ТОИ — табло отображения инфомации
ТПУ – транспортно-пересадочный узел
ТС — транспортное средство
УДЗ — управляемый дорожный знак
УДС — улично-дорожная сеть

Проектно-чертежная документация и работы
АИП — Адресная инвестиционная программа Москвы. Основной документ, в котором заложены в том числе все инфраструктурные стройки Москвы, включая дороги, метро, ТПУ.
ОДД — организация дорожного движения
ПОДД — проект организации дорожного движения (включает расстановку знаков, дорожную разметку с размерами, расстановку светофоров и т.д.)
ПП — проект планировки (принципиальная схема движения в увязке с будущими и существующими дорогами, выносится на общественные слушания, включает несколько схем и несколько десятков страниц)
ПСД — проектно-сметная документация (основной объем технической документации, по которой ведется стройка, включает сотни или тысячи страниц)
СМР — строительно-монтажные работы (сама стройка)

Нормативная документация
ГОСТ Р — национальный стандарт Российской Федерации
ГОСТ — межгосударственный стандарт стран СНГ либо стран Таможенного союза
ВСН — ведомственные строительные нормы
МГСН — Московские городские строительные нормы
ОСТ — отраслевой стандарт
ПДД — Правила дорожного движения
СНиП — строительные нормы и правила
СП — свод правил (актуализированная редакция СНиП)
СТО (СТП) — стандарт организации (предприятия)
СТУ — специальные технические условия
ТУ — технические условия

Органы власти и управления Москвы
Транспортный комплекс возглавляет заместитель мэра Ликсутов Максим Станиславович. В состав комплекса входят:
ДТ — Департамент транспорта (руководитель также М. С. Ликсутов)
МАДИ — Московская административная дорожная инспекция (Овсянников Юрий Петрович)

Департаменту транспорта подчиняются:
ЦОДД — ГКУ «Центр организации дорожного движения» (Юрьев Вадим Юрьевич)
МГТ — ГУП «МосГорТранс» (Михайлов Евгений Федорович)
АМПП — ГКУ «Администратор московского парковочного пространства» (Гривняк Александр Иванович)
МКЖД — ОАО «Московская кольцевая железная дорога» (Зотов Алексей Вячеславович)
У ДТ есть и другие «подведы», например ГУПы «Московский метрополитен» и «Организатор перевозок», но их названия не сокращают.

Комплекс ЖКХиБ (жилищно-коммунального хозяйства и благоустройства) возглавляет заместитель мэра Бирюков Петр Павлович.  В составе комплекса вопросами дорог занимаются:
ДКР — Департамент капитального ремонта (Михайличенко Виталий Владимирович)
ДЖКХиБ — Департамент жилищно-коммунального хозяйства и благоустройства (Самсонов Александр Михайлович)

Строительный комплекс возглавляет заместитель мэра Хуснуллин Марат Шакирзянович. Дорогами в стройкомплексе занимаются в первую очередь:
ДС — Департамент строительства (Бочкарев Андрей Юрьевич)
ДГП – Департамент градостроительной политики (Лёвкин Сергей Иванович)
МКА – МосКомАрхитектура, он же Комитет по архитектуре и градостроительству (Княжевская Юлиана Владимировна)
НИиПИ Генплана — Научно-исследовательский и проектный институт Генерального плана города Москвы (Крестмейн Михаил Германович)

Контрольно-надзорный орган
ОАТИ — Объединение административно-технических инспекций

Другие органы власти Москвы и подробности: www.mos.ru/authority/structure/scheme/#/

Органы власти и управления Московской области
Минтранс МО – Министерство транспорта Московской области (Олейник Михаил Геннадьевич)
ГУДХ МО — Главное управление дорожного хозяйства Московской области (Ляшкевич Константин Васильевич).
Ему подчиняется ГБУ «Мосавтодор» (Цэрнэ Андрей Владимирович)

Если встречали еще какой-то непонятный термин в сфере дорог и транспорта – присылайте, по возможности расшифрую и включу в статью.

Если вам понравилась статья, добавьте мой блог в друзья или подпишитесь на него в Facebook или Twitter.

МВД не хочет отдавать «штрафы» Москве

Сейчас Московская административная дорожная инспекция (МАДИ) штрафует вместо ГИБДД только нарушителей правил парковки. Столичные власти пытаются добиться передачи МАДИ полномочий по выписыванию штрафов почти за все нарушения, фиксируемые камерами. Соответствующий законопроект подготовлен по поручению первого вице-премьера Игоря Шувалова и на данный момент внесен в Госдуму. В октябре 2015 года господин Шувалов попросил премьера ускорить принятие документа.

С тех пор ситуация развивалась следующим образом. МВД настаивает на том, что полномочия передавать нельзя ни в коем случае. В распоряжении есть письмо начальника ГИБДД России Виктора Нилова на имя министра Владимира Колокольцева, где он сообщает о дополнительных «рисках», которые могут возникнуть при принятии законопроекта. В настоящее время, считает он, «степень готовности» МАДИ «недостаточна для рассмотрения вопроса о передаче полномочий», поскольку «не налажена работа по надлежащему исполнению уже переданных полномочий» (речь идет о контроле за нарушителями парковки). МВД проводило проверку в 2014–2015 годах, выявив массу недостатков в работе МАДИ, которые до сих пор не устранены. «Не привлекаются к ответственности отдельные собственники транспортных средств»,— уточняет начальник ГИБДД.

В качестве примеров риска господин Нилов приводит следующие факты. Правительство Москвы, в частности, использует информационную систему и технические средства, не защищенные от «неправомерного доступа к информации и персональным данным». Госавтоинспекцию беспокоит, что у Москвы появится доступ к информации о перемещениях авто с «закрытыми» номерами и машин лиц, подлежащих госохране. «Кроме того, возможна расшифровка принадлежности транспортных средств оперативных служб, использующих временные подменные государственные знаки при проведении оперативно-разыскных мероприятий»,— пишет господин Нилов.

В связи с этими рисками глава ГИБДД просит известить первого вице-премьера Игоря Шувалова о необходимости провести совещание на тему полномочий с участием ФСБ, ФСТЭК, Генпрокуратуры и лично мэра Москвы Сергея Собянина. Господин Колокольцев, в свою очередь, в своей резолюции на письмо Виктора Нилова указал: «Предлагаю снять этот вопрос (о какой-то последующей передаче)».

Главный противник передачи полномочий депутат Вячеслав Лысаков, в свою очередь, всячески препятствует принятию правительственного законопроекта в Госдуме. Он внес в парламент законопроект о создании единого центра фотовидеофиксаций нарушений. Решением думского комитета по госстроительству документ признан альтернативным правительственному, что позволило передвинуть сроки рассмотрения обоих документов на январь 2016 года. «При этом, несмотря на отрицательную позицию ГИБДД и министра Владимира Колокольцева, законопроект о передаче полномочий поддерживает замминистра Игорь Зубов, что выглядит довольно странным,— рассказал Вячеслав Лысаков.— МВД всегда было против передачи полномочий, и эта линия должна быть выдержана на всех уровнях. Я хочу встретиться на эту тему с министром, однако пока встречу организовать не удается».

В Белом доме призывают депутатов не драматизировать ситуацию вокруг передачи полномочий. «Понятно, что этот вопрос вызывает у некоторых участников процесса определенную обеспокоенность,— заявили в секретариате первого вице-премьера Игоря Шувалова.— Позиции по этому вопросу есть у ГИБДД и у Москвы. Но в передаче полномочий имеется логика мировой практики. В большинстве стран полиция этим вопросом не занимается, это все входит в полномочия городских властей. Кроме того, Москва готова вложить свои ресурсы как в технические средства контроля, так и в благоустройство территорий с точки зрения безопасности дорожного движения. В свою очередь, полиция разгружается от непрофильных административных функций и концентрируется на основных правоохранительных задачах». В секретариате также отметили, что вопрос о передаче полномочий сейчас обсуждается со всеми ведомствами и экспертным сообществом.

Инфостилеры «Мади» — подробный анализ

17 июля мы опубликовали блог о Мади и продолжающейся кампании по проникновению в компьютерные системы по всему Ближнему Востоку, нацеленной на пользователей в Иране, Израиле, Афганистане и других людей, разбросанных по всему миру. Вот продолжение с подробным анализом инфостиллера, использованного в кампании.

Установка

Инфостилер устанавливается одним из различных загрузчиков, используемых в атаках, которые можно разделить на две категории:

  • Загрузчики, использующие методы социальной инженерии, описанные в нашем первом сообщении в блоге (отображение изображений, фильмов, документов и т. Д.)) чтобы обмануть пользователя
  • Загрузчики, которые просто загружают и устанавливают инфостилер

Оба типа загрузчиков копируют себя как «UpdateOffice.exe» в каталог «Printhood», например: «C: Documents and Settings% USER% PrintHoodUpdateOffice.exe», где они начинают выполнение.

И инфостилер, и загрузчики создают поддельные файлы со случайными именами в своих папках. Загрузчики также сбрасывают некоторые файлы, которые помогают вредоносному ПО (подробности см. В нашем первом блоге).

Инфостиллер будет использовать только один файл: nam.dll. Этот файл создается загрузчиком в каталоге «Шаблоны» (например: «C: Documents and Settings% USER% Templatesnam. dll») и содержит префикс / сборку BOT, который будет использоваться информационным стилером при подключении к команде и сервер управления (C&C). Чтобы загрузить и установить инфостилер, загрузчики подключаются к C&C серверу, чтобы запросить HTM-страницу.

В старых вариантах используется http: // [адрес C&C] / ASLK / khaki / Abi / UUUU.htm, тогда как более поздние используют «http: // [C&C адрес] /ASLK/asgari/mah/UeUeUeUe.htm».

HTM-страница является копией индекса Google, в нее встроен исполняемый файл с двойной кодировкой BASE64:

Ключевое слово «tamamshodfile» внизу будет объяснено в разделе «Анализ инфостилера» ниже.

Загрузчики просто анализируют HTM-файл, дважды декодируют полезную нагрузку Base64 и сохраняют полученный PE-файл как «iexplore.exe» в каталоге «Templates».После загрузки запускается инфостилер.

Анализ Infostealer: Iexplore.exe

Все версии инфостилера имеют значок Internet Explorer и написаны на Delphi.

Версия, использованная в этой статье, которая, по-видимому, была скомпилирована 10 июня 2012 года, упакована с использованием UPX 3. 08.

Файл довольно большой: 415 КБ в упакованном виде и 1,14 МБ в распакованном виде.

Одной из особенностей инфостиллера, используемого в кампании Madi, является интенсивное использование таймеров Delphi.Их 52, как видно на скриншоте ниже:

.

При анализе инфостилера было обнаружено множество ошибок. Некоторые из них здесь не обсуждаются, поскольку мы не хотим помогать авторам улучшать их вредоносное ПО.

TForm4.FormCreate:

После выполнения первое интересное действие, выполняемое инфостилером, происходит внутри TForm4.FormCreate.

Начинается с настройки кейлоггера. Для этого Madi infostealer использует функцию Windows «SetWindowsHookEx» с идентификатором «WH_KEYBOARD_LL» Id_Hook.

После установки кейлоггера infostealer считывает файл «nam.dll» (сброшенный загрузчиком), чтобы получить префикс BOT, и объединяет его с именем компьютера. В дальнейшем он будет называться «BOTID_TMP». Последний BOTID содержит некоторые числа, полученные из серийного номера тома «C:», как мы увидим позже.

Затем в указанном порядке отключаются следующие таймеры:

Timer1, Timer16, Timer18, Timer17, Timer20, Timer19, Timer24, Timer8, Timer30, Timer31, Timer33, Timer34, Timer36, Timer37, Timer38, Timer39, Timer40, Timer41, Timer44, Timer45, Timer46, Timer48, Timer50, Timer50

Вредоносная программа использует множество внешних файлов для приема команд, что является еще одним показателем плохих навыков программирования. Эти файлы используются для информирования вредоносного ПО о статусе заражения. Во избежание недоразумений в дальнейшем при обращении к файлу он находится в каталоге вредоносных программ (каталог «Шаблоны»), если не указано иное.

Инфостилер ищет следующие файлы:

«fsdiskget.dll»: если он найден, он включает Таймер 23 — в противном случае отключает его.

«nrbindek.dll »: если он найден, он включает Таймер 28 — в противном случае отключает его.

«specialfile.dll»: при обнаружении удаляет его.

«filesend.xls»: на самом деле не ищет; просто пытается его удалить.

«beginirnagir.htp»: если НЕ найден, таймер 3 отключается.

«filebind.xls»: если он найден, он включает Timer29 — в противном случае отключает его.

Далее оба таймера Timer14 и Timer13 отключены.

Троянец ищет файл «First.dll», который создается при первом запуске вредоносной программы.

Если уже присутствует, код возвращается из TForm4.FormCreate. В противном случае произойдет следующее.

Он создает first.dll с жестко запрограммированным потоком байтов (не настоящий .dll, как упомянутая выше .dll, как мы увидим позже, когда мы более внимательно проанализируем таймеры).

Подобно загрузчикам, инфостилер также генерирует поддельные файлы со случайными именами. Перед возвратом из TForm4.FormCreate будет выполнено 6 циклов:

XLS: 51 поддельный файл XLS со случайными именами (7 символов) генерируется с использованием жестко закодированного потока байтов.

EXE: 51 поддельный EXE-файл со случайными именами (6 символов) генерируется с использованием жестко закодированного потока байтов.

DLL: 201 поддельный файл DLL со случайными именами (9 символов) генерируется с использованием жестко запрограммированного потока байтов.

TXT: 51 поддельный файл TXT со случайными именами (4 символа) генерируется с использованием жестко закодированного потока байтов.

XML: 51 поддельный XML-файл со случайными именами (8 символов) генерируется с использованием жестко закодированного потока байтов.

HTM: 51 поддельный файл HTM со случайными именами (8 символов) генерируется с использованием жестко закодированного потока байтов.

Анализ кейлоггера:

Как упоминалось ранее, настройка кейлоггера выполняется в TForm4.FormCreate. Он использует «SetWindowsHookEx» с «WH_KEYBOARD_LL» Id_hook для перехвата нажатий клавиш.

Функция перехвата довольно рудиментарна. Например, он использует GetAsyncKeyState с «VK_BACK», чтобы узнать, использовала ли жертва backspace.

Для каждого введенного ключа существует обработчик, который сохраняет, какой ключ был введен в буфер кейлоггера «poki65_pik_log»:

Неудивительно, что кейлоггер очень прост и не использует никаких передовых технологий.

Вредоносная программа использует 52 таймера. Поэтому мы сгруппируем их по действиям, чтобы упростить общий анализ.

Управление и контроль: протокол

Теперь мы собираемся охватить все таймеры, отвечающие за связь с C&C сервером и получение команд для выполнения на зараженной машине, а также все различные обработчики, используемые для выполнения действий в соответствии с этими приказами.

Примечание: во многих подпрограммах Madi создает файлы «.bat», чтобы проверить связь с C&C сервером, чтобы узнать, работает он или нет, и сохраняет результат в специальном файле.У каждого файла свое имя. Если на эти файлы есть ссылка, мы предоставим номер таймера, ответственного за его создание.

Диспетчер серверов выглядит так:

Графический интерфейс, вероятно, был поспешным, но он служит своей цели. Его можно использовать для создания конкретных задач для жертв. См. Таймер 12, чтобы узнать, как каждая команда обрабатывается инфостилером.

Таймер 1: Прибытие

Интервал: 25 секунд

Перед получением команд инфостилер подключается к C&C на специальной странице.Я называю это рутиной регистрации. Вот описание:

Таймер 1 получает ApplicationName и объединяет его с «.pkklm» (подробности о том, как создается этот файл, см. В описании таймера 15). Он пытается открыть этот файл в поисках строки «Ответить от» (когда IP-адрес отвечает на эхо-запрос). Если он не найден, он отключает Таймер 1 и возвращается.

Если присутствует, последняя часть BOTID генерируется с использованием серийного номера тома «C:».

В основном функция API GetVolumeInformationW вызывается для получения серийного номера тома, который затем объединяется с BOTID_TMP, созданным в TForm4.FormCreate. Теперь, когда окончательный BOTID был сгенерирован, последний посещаемый URL генерируется следующим образом:

BOTID | COMPUTERNAME | VolumeSerialNumber / dastor / file.htm
например: abaanu5 | MYCOMPUTER-8712422C | 6D8704FE / dastor / file. htm

Конечный URL-адрес посещается с помощью инструментария Internet Explorer (IE).
(например: http: //C&C/abaanu5MYCOMPUTER-8712422C6C7704EF/dastor/file.htm)

После посещения он включает Таймер 18, отключает Таймер 1 и возвращается.

Это процесс проверки, который может сообщить злоумышленникам, когда компьютер жертвы готов к приему команд.

После того, как злоумышленники решили отправить команды на зараженный компьютер, в папке «/ dastor /» появится файл «das.htm».

Таймер 16: посетить страницу команд

Интервал: 25 секунд

Таймер 1 получает ApplicationName и объединяет его с «.pkxm» (результаты проверки связи от Таймера 11). Он пытается открыть этот файл в поисках строки «Ответить от» (когда IP-адрес отвечает на эхо-запрос).

Если он не найден, он отключает Таймер 16 и возвращается.

Конечный BOTID вычисляется (см. Описание Таймера 1) для построения URL-адреса, который посещается для получения команд. Перед посещением этого URL-адреса файл «dast.xls» удаляется (см. Таймер 17 ниже).

URL-адрес посещается с использованием инструментов IE. Таймер 17 включен, а Таймер 16 отключен.

Таймер 17: Сохраните командную страницу как «dast.xls»

Интервал: 20 секунд

Примечание. Во время работы Madi infostealer работает множество экземпляров IE.

Timer 17 будет просматривать все различные экземпляры инструментального IE в поисках страниц, в заголовке которых есть «dastor».После обнаружения содержимое страницы (без заголовка) сохраняется как «dast.xls».

Если ничего не найдено, он перейдет к следующему экземпляру IE и будет повторять проверки, пока не останется ни одного экземпляра. Если ничего не найдено, запускается процедура очистки.

В конце таймера 17 он ищет «- dastor — Windows Internet Explorer» и различные варианты (Internet Explorer) и отправляет сообщение «WM_Close», используя функцию «PostMessageW», чтобы закрыть страницу. Среди всех этих подписей он также ищет «- 404 — Файл или каталог не найден» и варианты 404 страниц, если страница не была найдена.

После завершения очистки Таймер 17 отключается и возвращается.
На данный момент у нас есть локальный файл с командами, которые нужно выполнить на зараженной машине.

Таймер 12: диспетчер команд

Этот таймер отвечает за анализ командного файла. Чтобы облегчить понимание описания, вот пример командного файла:

При выполнении Таймер 12 отключен.

Троян-инфостилер затем проверяет наличие файла «dast.xls »(создается таймером 17, см. выше).

Если его нет, Таймер 12 снова включается и возвращается.

На следующем этапе процесса открывается «dast.xls», который ищет команды для выполнения (см. Командный файл выше). Одновременно может быть отправлено множество команд, что означает, что Таймер 12 не прекратит синтаксический анализ, когда будет найдена одна команда. Вот полная логика разбора:

PIK:
Если командный файл содержит слово «pik», он проверяет, включен ли статус Таймера 3.(Таймер 3 — это процедура захвата экрана веб-почты, социальных сетей и мгновенных сообщений. )
Если не включен, таймер 3 включается и начинается мониторинг экрана. Анализ команды продолжается. Если команда «pik» не найдена, Timer3 отключен.

DESK:
Если командный файл содержит слово «стол», он проверяет, включен ли статус Таймера 13. (Таймер 13 — это процедура захвата экрана.)
Если не включен, Таймер 13 включается, и начинается мониторинг экрана. Анализ команды продолжается. Если команда «desk» не найдена, Timer13 отключен.

ЗВУК:
Если командный файл содержит слово «звук», он проверяет, включен ли статус Таймера 14. (Таймер 14 — это процедура записи звука.)
Если не включен, таймер 14 включается, и начинается запись звука. Анализ команды продолжается. Если команда «звук» не найдена, Timer14 отключен.

Если командный файл содержит слово «newfi», ничего не происходит. Вероятно, это остатки старого кода.

ОБНОВЛЕНИЕ:

Если командный файл содержит слово «обновить», он проверяет, содержит ли он также номер версии, который должен отличаться от текущей версии («1. 1,6 ”в анализируемом образце). Если ни одно из этих двух условий не является допустимым, он переходит к синтаксическому анализу следующей команды. Процедура проверки очень упрощена и предполагает, что номер версии будет выше, а не ниже. Таким образом, есть возможность понизить версию троянца.

Если требуемые критерии обновления соблюдены, будет создан файл «Update.dll». (Update.dll создается из жестко запрограммированного потока байтов и не является допустимой DLL.)

Троянец теперь находит папку «ЗАПУСК», в которой находится копия файла «UpdateOffice.exe »(троянский загрузчик) и запускает его с помощью ShellExecute. (В первой части статьи мы объяснили, как загрузчик загружает и устанавливает инфостилер.)

Загрузчик троянца необходим для выполнения обновлений. Если по какой-либо причине загрузчик был удален, обновление не будет выполнено.

После запуска Timer 12 прекращает свое выполнение, так как исполняемый файл информационного крана (iexplore.exe) будет перезаписан троянским загрузчиком новой версией и запущен.

УДАЛИТЬ:

Если командный файл содержит слово «удалить», он создаст «delete.dll», используя точно такой же поток байтов, который используется в «update.dll».

Троянец теперь находит папку «STARTUP», в которой находится копия загрузчика «UpdateOffice.exe», и удаляет ее. После удаления он прекращает работу.

На этом этапе при следующей перезагрузке заражение не возобновляется.

Примечание. Infostealer не перезагружается сам по себе, позволяя выполнять автоматическое обновление каждый раз при перезагрузке компьютера.

С другой стороны, все остальные файлы загрузчика (не вредоносные) все еще присутствуют в папке / printhood /. Полная папка инфостилера все еще присутствует, как и вредоносная программа.

BIND:
Если ни «обновить», ни «удалить» не найдено, Таймер 12 проверяет, содержит ли командный файл слово «привязка», и создает «nrbindek.dll», используя точно такой же поток байтов, который используется в «обновлении». dll ».

Больше ничего не происходит. Однако, как мы видели при создании формы, после выполнения вредоносная программа проверяет, существует ли «nrbindek.dll ».

Если он присутствует, Таймер 12 включает Таймер 28.

Если «привязка» не найдена, синтаксический анализ продолжается со следующей команды.

DISKGO:
Если командный файл содержит слово «diskgo», он создаст «lbdiskgo.dll», используя точно такой же поток байтов, который используется в «update.dll». Анализ продолжается со следующей команды.

Примечание. «Lbdiskgo.dll» проверяется таймером 42 и таймером 43.

DISKGET:
Если командный файл содержит слово «diskget», будет создан «fskdiskget.dll », используя тот же поток байтов, что и в« update.dll », и включите таймер 23.

Таймер 12 затем проверяет наличие «specialfile.dll». Если НЕТ, он будет искать расширения файлов, включенные в полученную команду. Злоумышленники выбирают из списка 27 расширений, которые предоставляются сервером C&C и которые можно выбрать с помощью средства удаленного управления (см. В начале описания Таймера 12, чтобы просмотреть расширения, перечисленные в образце командного файла).
Каждое расширение файла отделяется специальным маркером «$. $».

Таймер 12 ищет маркер «$. $». Если его нет, синтаксический анализ на этом останавливается.

Если маркер присутствует, он сохраняет эти расширения в «specialfile.dll» и включает Таймер 26.

Примечание: Specialfile.dll поэтому используется, чтобы сообщить вредоносной программе, какие расширения файлов искать, а Timer 26 будет обрабатывать diskget.

После этого, или если файл specialfile.dll уже присутствовал, он проверит, существует ли файл «logfi.dll ”
, и прекратить анализ команд, если это не так.

Если файл присутствует, он ищет в буфере команд слово «файл» и завершает анализ команд, если не найден.

Если присутствует файл logfil.dll, он будет искать файлы на фиксированных жестких дисках и удаленных дисках. В этой части кода очень заметны слабые навыки программирования авторов.

Также интересно отметить, что он будет искать файлы «MHTML», даже если эта опция недоступна в инструменте управления сервером, и что они сделали дублирующую запись в списке жестких кодов файлов, которые необходимо найти (htm присутствует дважды).

Найденные типы файлов:

*. * Txt /*.* jpg /*.* doc /*.* pdf /*.* bmp /*.* docx /*.* mdb /*.* xls /*.* csv /*.* html /*.*avi/
*. * mp3 /*.* wave /*.* htm /*.* rar /*.* zip /*.* htm
(снова?!) /*.* gif / *. * 7z /*.* jar /*.* JPEG /*.* mp4 /*.* 3gp /
*. * Dat /*.* MPEG /*.* SWF /*.* WMV /*.* xml / * . * MHTML /

Всего 29 добавочных номеров, один дубликат. В инструменте управления сервером присутствует 27 расширений, а в одном нет (MHTML).

Он сохраняет файл журнала как «logfi.dll» для каждого жесткого диска и создает резервную копию как «logfi.dll.BMH ». Он будет перезаписывать журналы для каждой итерации цикла.

Поиск файлов только на удаленных и фиксированных дисках, но не на USB / внешних дисках; это для лесозаготовительной части.

После завершения синтаксического анализа Таймер 12 повторно активируется и завершает работу.

Мониторинг

Таймер 3: обработчик PIK — веб-почта, социальные сети и захват экрана мгновенных сообщений

Интервал: 60 секунд.

Таймер 3 создает файл «beginirnagir.htp».

Затем он проверяет, просматривает ли пользователь следующие приложения или использует их, и делает снимок экрана, если обнаружен:

Gmail, Hotmail, Yahoo! почта, google +, msn messenger, blogger, massenger (?), профиль, icq, paltalk, yahoo! мессенджер для сети, скайп, фейсбук.

Снимки экрана сохраняются в формате JPG с использованием следующего соглашения об именах: мм-дд-гггг-ччнсс. Используются функции «Сейчас» и «FormateDateTime».

Таймер 13: обработчик DESK — снимок экрана

Интервал: 3 минуты

Примечание: графический интерфейс, используемый для управления ботом, показывает 2 минуты, но код не врет.

Таймер 13 делает снимки экрана каждые 3 минуты. Они сохраняются с использованием следующего соглашения об именах: мм-дд-гггг-ччнсс. Используются функции «Сейчас» и «FormateDateTime».

Файлы в формате JPG.

Таймер 14: Обработчик ЗВУКА — Запись звука

Этот таймер отвечает за запуск аудиозаписи с использованием функций mci * из winmm.dll.

Используются следующие команды: «OPEN NEW TYPE WAVEAUDIO ALIAS mysound», «SET mysound TIME FORMAT MS BITSPERSAMPLE 8 CHANNELS 1 SAMPLESPERSEC 8000 BYTESPERSEC 8000» и, наконец, «RECORD mysound».
После отправки команд Таймер 30 включается, и Таймер 14 возвращается.

Таймер 30: запускается таймером 14 (обработчик звуковых команд)

Интервал: 60 секунд

Этот таймер делает что-либо, кроме запуска таймера 31, когда пора сохранять записанный звук.

Таймер 31: запускается таймером 30 (когда пора сохранять аудиозаписи)

Когда с начала аудиозаписи прошло достаточно времени, Таймер 31 отключает Таймер 30, останавливает запись, отправляя следующую команду: «STOP mysound».

Для сохранения аудиофайлов он отправляет команду «SAVE mysound». Файлы сохраняются с использованием следующего соглашения об именах: мм-дд-гггг-ччнсс. Используются функции «Сейчас» и «FormateDateTime».

Окончательный файл сохраняется как.wav.BMH.

Таймер 31 отключается, а Таймер 14 (обработчик звука) снова включается для следующей аудиозаписи.

Таймер 32: настройка кейлоггера

Интервал: 60 секунд

Несмотря на то, что настройка кейлоггера выполняется при запуске приложения, в подпрограмме FormCreate Таймер 32 устанавливает кейлоггер каждые 60 секунд. Детали кейлоггера уже были описаны ранее в этом документе.

Таймер 2: создание журналов кейлоггера

Интервал: 10 секунд

Таймер 2 запускается с получения текущего имени пользователя (функция API GetUserName), а затем проверяет, есть ли «poki65.pik ». Этот файл является текущим файлом кейлоггеров. Если его нет, он ищет «solt.html», который указывает, создал ли кейлоггер свой первый журнал.

Если ни один из этих файлов отсутствует, это означает, что это первый раз, когда кейлоггер начал регистрацию.

Первый файл журнала отличается от последующих файлов журнала, поскольку он содержит больше информации. Файлы кейлоггера Madi используют HTML-теги и цвета, чтобы их было легче читать.

Для первого журнала выполняется «cmd.exe / c ipconfig / allcompartments> ipconfig.txt ”

Ожидает 5 секунд и добавляет содержимое «ipconfig.txt» к создаваемому содержимому HTML.

Имя компьютера, а также имя текущего пользователя добавляются в журнал, за которым следует список доступных дисков: дисковод гибких дисков, фиксированный диск, сетевой диск, дисковод компакт-дисков и RAM-диск.

Наконец, полный список установленного программного обеспечения, включая исправления безопасности, добавляется к файлу журнала,
, как показано на скриншоте ниже:

После завершения этой части создается файл с именем «solt.htm », содержащий слово« wertik ».

Продолжит форматирование файла журнала poki65. В самом начале вы можете увидеть, что «Content-Language» установлен на «fa», что означает персидский язык.

Так создаются журналы кейлоггера.

Таймер 4: вставьте отметки времени и теги для отображения снимков экрана в журналах кейлоггера.

Интервал: 1 миллисекунда

Таймер 4 отвечает за вставку тегов IMG в журнал кейлоггера. Он также отвечает за добавление отметки времени, взятой с сервера C&C (см. Раздел «Разное», Таймер 7 и 8).

Таймер 6: Резервное копирование журнала кейлоггера для эксфильтрации

Таймер 6 ищет файл poki65.pik — текущую сессию журнала. Если не найден, возвращается.

Затем он ищет размер файла журнала. Если он меньше 15 КБ, он вернется.
Отфильтровываются только файлы журналов, размер которых превышает 15 КБ. Если критерии размера соблюдены, они копируются с использованием следующего соглашения об именах: мм-дд-гггг-ччнсс.HTM. Таймер 6 затем удаляет poki65. pik и возвращается.

Примечание: новый журнал будет создан Таймером 2 (solt.html сообщает кейлоггеру, чтобы он больше не перечислял диски, установленное программное обеспечение и т. д.).

КРАЖЕНИЕ ДАННЫХ

Кража данных обрабатывается несколькими таймерами. Каждый тип украденных данных хранится в специальной папке на сервере. Файлы, отправленные на серверы C&C, имеют кодировку Base64.

ПРИЯВКА:

Таймер 28: запущен во время создания формы (относится к команде BIND)

Примечание: при запуске информационного крана Таймер 28 включается, если присутствует файл «nrbindek.dll» (созданный командой BIND).

Таймер 28 выполняет поиск файлов «*. * Exe» на всех жестких дисках. Для каждого найденного файла * EXE *, который не принадлежит папкам «Windows», «Program Files» или «Program Files (x86)», в привязку файла добавляется запись (полный путь к файлу * EXE *). xls.

После сканирования жестких дисков возвращается Timer28.

Таким образом,

Filebind. xls содержит все исполняемые файлы на фиксированных жестких дисках, кроме тех, что находятся в Windows и Program Files.

Таймер 29: запущен во время создания формы (относится к команде BIND)

Примечание. Код этого таймера — один из худших, используемых в инфостилере.Программирование, запутанное с помощью Delphi, очень плохое.

Timer 28 генерирует список файлов * EXE *, которые не принадлежат папкам «Windows», «Program Files» или «Program Files (x86)». Для каждой записи этого файла Таймер 29 сделает резервную копию исполняемых файлов. К их исходному имени добавляется расширение * .bind *.

Многие файлы используются для отслеживания статуса эксфильтрации исполняемых файлов.

Однако Таймер 29 на самом деле ничего не извлекает, вероятно, из-за ошибок.

Таймер 9: проверка файлов, готовых к загрузке

Интервал: 5 секунд

Таймер 9 отключен. Если включен таймер 19 или таймер 20, это означает, что уже существует активная задача по удалению. Таймер 9 включен, и он возвращается.

В противном случае Таймер 9 ищет файлы *. * KILOP, а также файлы * .htm.BMH * в каталоге вредоносных программ. Файлы KILOP — это версии файлов для эксфильтрации в кодировке Base64. Если файл не найден, Таймер 9 включается и возвращается.

Если файлы присутствуют, они готовы к удалению, и Таймер 19 включен.
Перед возвратом таймер 9 включен.

Таймер 19: проверьте, использовались ли инструменты IE для посещения страницы загрузки.

Интервал: 25 секунд

Таймер 19 выполняет поиск определенного заголовка страницы:

Если обнаружен заголовок страницы «новый заголовок хастам — Microsoft Internet Explorer», Таймер 19 возвращается.

«OKshodiha — Windows Internet Explorer» означает, что файл готов к загрузке — Таймер 20 включен и возвращается.

Если ни один из этих заголовков не найден, Timer 19 запускает IE_Instrumentation и обращается к Sendfilejj.html, включает Таймер 20, а затем возвращается.

Таймер 20: загрузка файла

Таймер 20 ищет файлы *. * KILOP, вычисляет BOTID (подробности см. В Таймере 1) и заполняет параметры POST. Формы «S0», «S1» и «S2», представленные в файле Sendfilejj.html, «заполняются», и файл загружается с помощью IE Instrumentation.

T3, это папка BOTID +, используемая для загрузки (см. Ниже)

T2 — это имя файла

T1 — это содержимое файла в кодировке Base64.

Для вычисления T3 к BOTID добавляется следующая папка (у каждой жертвы есть корневая папка, названная в честь BOTID на C&C).

“/ Pi /” для .jpg. BMH — снимки экрана

“Te / для .htm.BMH — журналы кейлоггера

“/ So / для .wav.BMH — Аудиозаписи

«/ Fi /» для important.file.BMH

/ Fi / CoolDisk / ”для .fildik.BMH (данные, украденные со съемных дисков)

Файлы отправляются через страницу Sendfilejj.html, размещенную на C&C, которая является оболочкой для сценария «sik.php», используемого для получения отфильтрованных данных.

Таймер 5: кодировщик Base64 для извлеченных данных

Интервал: 1 миллисекунда

При срабатывании отключает Таймер 5, ищет *.* Файлы BMH (файлы, которые будут удалены после кодирования Base64) в папке вредоносных программ. Когда один файл найден, он проверяет, действительно ли файл находится на диске и доступен ли он. Он кодирует его в Base64 и сохраняет как nameoffile.BMH.KILOP. Некодированная версия (BMH) удаляется, Таймер 5 снова включается и возвращается. Файлы обрабатываются один за другим, но интервал таймера очень маленький, поэтому он почти мгновенный.

Примечание. Полученные в результате закодированные файлы обрабатываются Таймером 20, описанным выше.Процесс происходит следующим образом: Таймер 9 включает Таймер 19, который позволяет Таймеру 20 загружать файлы, созданные таймером 5.

Таймер 21: синтаксический анализатор Filesend.xls

Filesend.xls содержит список файлов для эксфильтрации.

При выполнении Таймер 21 отключен. Если присутствует «filesend.xls», он открывается и читается.

Все файлы, подлежащие удалению, разделяются символом «*», как в примере ниже:

* C: Документы и настройки% USER%

Desktoptoolsstealme.txt ** C: Документы и настройки% USER%

Desktoptoolsstealme2.txt *

Таймер 21 анализирует каждую запись и проверяет, существует ли файл. Если это так, копия файла будет сделана в каталоге вредоносных программ с расширением .file.BMH. (В моем примере это: «stealme.txt.file.BMH».)

Таймер 10: отслеживание того, что было загружено, и очистка страниц инструментов IE

Когда файл был загружен с использованием таймера 20, в файл sik.php выполняется POST, возвращается страница, содержащая имя загруженного файла, а также жестко закодированную строку «Сохранить Shode», как вы можете видеть на снимок экрана ниже:

Таймер 10 отвечает за отслеживание некоторых загруженных файлов.Извлеченные файлы добавляются в «rafteha.zip», в котором перечислены файлы, которые уже были обработаны. Путь к последнему обрабатываемому файлу сохраняется в файле «fileomade.xls».

Таймер 15: проверьте «filesend.xls»

Таймер 15 отключается при выполнении и выполняется поиск «filesend.xls». Если присутствует, Таймер 15 включен и возвращается.

Если нет, проверяется, включен ли Таймер 1. Если Таймер 1 включен, он включает Таймер 15 и возвращается.

Если Таймер 1 не активирован, Таймер 15 проверяет состояние Таймера 18.Если он включен, Таймер 15 снова включается и возвращается.

Если «filesend.xls» отсутствует, а таймер 1 и таймер 18 отключены, создается файл «pangtkp.bat», содержащий «ping C & C_IP> C: DOCUME ~ 1% USER% TEMPLA ~ 1iexplore.exe. .pkklm ».

Эта летучая мышь выполняется, и Таймер 1 и 5 активируются перед возвратом.

Существуют и другие таймеры, так или иначе связанные с эксфильтрацией и кражей данных, но все они довольно похожи. В этом вредоносном ПО много избыточности.

Таймер 23: список всех съемных дисков на машине

Таймер 23 перечисляет все съемные диски на машине, включает Таймер 24, Таймер 23 отключается и возвращается.

Таймер 24: поиск и копирование файлов со съемных дисков

Таймер 24 получает список съемных дисков, рассчитанный таймером 23, и выполняет поиск всех файлов на устройствах.

Украденные файлы будут скопированы в каталог вредоносных программ с расширениями fildik.BMH, которые в дальнейшем будут закодированы как fildik.BMH.KILOP (Base64) и удален.

Список обработанных файлов хранится внутри raftehacool.zip.

Разное

В инфостилере 52 таймера. Некоторые из них не выполняют никаких важных задач. Авторы решили проверить связь с C&C сервером и сохранить результаты под определенными именами файлов. Эти файлы проверяются и анализируются, чтобы узнать, работает ли C&C и можно ли предпринять определенные действия. Это довольно дилетантское программирование.

Таймер 44: простой пинг через pangtipo.летучая мышь

Таймер 44 отключен при выполнении. Таймер 44 проверяет, включен ли Таймер 45, и возвращает его, если он включен. (Таймер 44 включен перед возвратом. )
Если Таймер 45 отключен, создается файл «pangtipo.bat», который содержит «ping C & C_IP> C: DOCUME ~ 1% USER% TEMPLA ~ 1iexplore.exe.pkxml».

Bat-файл выполняется, таймер 44 включен, и таймер 44 возвращается.

Таймер 11: простой пинг от pangtip.bat

Таймер 11 отключается при выполнении. Если Таймер 16 уже включен, Таймер 11 повторно активируется и возвращается.Если Таймер 17 уже включен, Таймер 11 снова включается и возвращается.

Если ни один из таймеров не включен, он создает файл «pangtip.bat», содержащий «ping C & C_IP> C: DOCUME ~ 1% USER% TEMPLA ~ 1iexplore.exe.pkxm», и выполняет его через ShellExecute.

Таймер 16 включен и возвращается.

Примечание. Таймеры 1, 7, 11, 15, 44 и 48 генерируют эти командные файлы под разными именами, и результаты также сохраняются под разными именами.

Таймер 7: Был «timeip.php »посетили?

Таймер 7 отключен при выполнении. Таймер 7 проверяет, была ли посещена страница timeip. php. В противном случае он посещает страницу с помощью инструментов IE, Таймер 7 отключается и включает Таймер 8 (см. Описание ниже).

Создает файл «pangip.bat», содержащий «ping C & C_IP». Результаты сохраняются как «iexplore.exe.pkam».

Примечание: имя файла, используемое для сохранения вывода команд ping, основано на имени исполняемого файла infostealer, то есть «iexplore.исполняемый». Если исполняемый файл будет переименован, файлы журнала будут иметь другие имена.

Таймер 8: Анализ результатов посещения timeip.php

Скрипт timeip.php возвращает текущее время и IP-адрес жертвы. Результаты посещения (выполненного с помощью инструментов IE в таймере 7) сохраняются в буфере, который используется во время создания журнала кейлоггера (см. Описание таймера 4).

Таймер 22: Убедитесь, что есть резервная копия UpdateOffice (загрузчик)

Примечание. Загрузчик — единственное вредоносное ПО, которое запускается после загрузки Windows.Поэтому важно обеспечить создание различных резервных копий.

Таймер 22 проверяет, присутствует ли «UpdateOffice.exe» в каталоге (шаблонах) инфостилера. Этого не должно быть, поскольку он присутствует только в каталоге printhood. (См. Описание загрузчика в начале статьи.)

Поскольку его нет, он вызывает подпрограмму для получения пути к каталогу «Printhood» (GetSpecialFolderLocation с параметром CSIDL_PRINTHOOD). При объединении «UpdateOffice.exe »и папка« Printhood », отсутствует символ« », и, следовательно, в подпрограмме есть ошибки. Возвращаемая строка: «C: Documents and Settings% USER% PrintHoodUpdateOffice.exe» вместо
«C: Documents and Settings% USER% PrintHoodUpdateOffice.exe».

Затем он копирует (или, по крайней мере, пытается это сделать, поскольку путь неверен) «C: Documents and Settings% USER% PrintHoodUpdateOffice.exe» как «srAntiq.dll» в папке Templates.

Если «OfficeUpdate.exe» не присутствует в «printhood», создается копия из «srAntiq.dll ».

Он извлекает путь к папке автозагрузки с помощью CSIDL_STARTUP: «C: Documents and Settings% USER% Start MenuProgramsStartup».

Таймер 22 проверяет наличие «OfficeUpdate.exe» в этой папке; в противном случае он скопирует srAntiq.dll в папку автозагрузки и вернется из таймера 22.

Таймер 25: проверьте наличие «fsdiskget.dll»

Таймер 25 проверяет наличие «fsdiskget.dll» в каталоге вредоносных программ; если нет, то возвращается.

Если файл присутствует, он включает Таймер 23 (см. Описание в разделе «Кража данных»).

Таймер 42: проверка lbdiskgo.dll, soltanik.dll и res.exe

Таймер 42 проверяет, установлен ли флаг (установленный таймером 34 и сброшенный таймером 33) на 0 и присутствуют ли lbdiskgo.dll, soltanik.exe и res.exe. Если да, то включается Таймер 33; в противном случае он возвращается.

Таймер 43: проверка lbdiskgo.dll / ladine.dll / res.exe

Таймер 43 возвращается напрямую, если нет ни lbdiskgo.dll, ни ladine.dll. Если присутствует файл res.exe, он включает Таймер 44 и Таймер 48; в противном случае он возвращается.

Таймер 45: Посетите страницу ReReReRe.
htm

Таймер 45 удаляет pangtipo.bat, читает iexplore.pkxml, чтобы убедиться, что C&C ответил. (Таймер 1 и Таймер 16 предоставляют некоторые дополнительные сведения об использовании таких файлов .bat.)

Использует FindWindow, чтобы проверить, использовался ли IE Instrumentation для посещения специальной страницы ReReReRe.html, которая содержит следующий заголовок: «r! R! R! R!».

Ищет разные варианты, такие как «r! R! R! R! — Windows Internet Explorer »или« r! R! R! R! — Microsoft Internet Explorer ».

Если один из них найден, это означает, что страница была посещена с использованием инструментария IE. Он отключает Таймер 45 и возвращается.

Если ни один из них не найден, Таймер 45 посетит URL http: //C&CIP/ASLK//asgari/mah/ReReReRe.htm, включит Таймер 46 (см. Ниже), отключит Таймер 45 и вернется.

Таймер 46: синтаксический анализ «ReReReRe.htm» (загружается таймером 45)

Таймер 46 просматривает все различные запущенные экземпляры инструментального IE, просматривая заголовок каждой HTM-страницы. Главный интерес здесь — «р! Р! Р! Р!».

Эта страница представляет собой файл ReReReRe.htm, загруженный таймером 45. Таймер 46 ищет специальный маркер EOF (конец файла): «tamamshodfile». Этот маркер используется инфостилером, чтобы убедиться, что htm-страница была полностью загружена.

Как только страница подтверждена как действительная, она ищет идентификатор текстового поля S1, который содержит PE-файлы с двойной кодировкой Base64.

Данные в кодировке Base64 сохраняются как: ASLASLKK223.dll.

Таймер 47: Двойное декодирование полезной нагрузки в кодировке Base64 из ReReReRe.htm

Примечание. Таймер 46 сохраняет полезную нагрузку как ASLASLKK223.dll.

Поскольку файл полезной нагрузки имеет двойное кодирование, декодирование выполняется в два этапа:

  • ASLASLKK223.dll декодируется в ASLASLKK224.dll для получения одного закодированного файла Base64.
  • ASLASLKK224.dll декодируется в «res.exe»: окончательный PE-файл.

Res.exe — это копия утилиты Resource Hacker. ASLASLKK224.dll удаляется.
Использование Res.exe описано в анализе Таймера 39 ниже.

Как только Timer 47 завершит перечисление всех экземпляров IE, он вызовет процедуру очистки. Он ищет «- р! Р! Р! Р! — Windows Internet Explorer »и различные варианты, описанные в Таймере 45, и отправляет сообщение« WM_Close »в IE Windows, чтобы закрыть их.

Среди всех этих подписей он также ищет «- 404 — Файл или каталог не найдены». и варианты 404 страницы.

По завершении очистки Таймер 47 отключается и возвращается в исходное состояние.

Таймер 49: Посетите страницу SeSeSeSe.htm

Timer 49 практически идентичен Timer 45. Единственное отличие — это посещаемая страница: SeSeSeSe.htm вместо ReReReRe.htm

Подробности см. В описании Таймера 45.

Таймер 50: синтаксический анализ «SeSeSeSe.htm» (загружен таймером 49)

Timer 50 практически идентичен Timer 46. Единственное отличие — это анализируемая страница: SeSeSeSe. htm вместо ReReReRe.htm и имена локальных файлов. Полезные данные с двойным кодированием сохраняются как «ASLASLKK2231.dll ».

Подробности см. В описании Таймера 46.

Таймер 51: Двойное декодирование полезной нагрузки в кодировке Base64 из SeSeSeSe.htm

Примечание. Таймер 50 сохраняет полезную нагрузку как ASLASLKK2231.dll.

Поскольку файл полезной нагрузки имеет двойное кодирование, декодирование выполняется в два этапа:

  • ASLASLKK2231.dll декодируется в ASLASLKK2241.dll для получения одного закодированного файла Base64.
  • ASLASLKK2241.dll декодируется в «Ladine.dll»: окончательный PE-файл.

Примечание: на момент написания SeSeSeSe.htm была удалена с C&C сервера.

C&C сервер, используемый старыми вариантами инфостилера, все еще доступен, и старое имя страницы было «SSSS.htm». Встроенный файл является шаблоном исполняемого файла загрузчика (дополнительную информацию см. В Таймерах 35, 36, 37, 38 и 39).

Как только Timer 51 завершит перечисление всех экземпляров IE, он вызовет процедуру очистки. Он ищет «- с! С! С! С!» — Windows Internet Explorer »и различные варианты, описанные в Таймере 45, и отправляет сообщение« WM_Close »в IE Windows, чтобы закрыть их.

Среди всех этих подписей он также ищет «- 404 — Файл или каталог не найдены». и варианты 404 страницы.

По завершении очистки Таймер 51 отключается и возвращается в исходное состояние.

БЕТА / НЕРАБОТАЮЩИЕ ФУНКЦИИ: Новое поколение исполняемых файлов

В инфостилере есть несколько таймеров, связанных с отсутствующим файлом. Мне удалось найти копию отсутствующего файла на более старом сервере управления и контроля, чтобы понять намерения авторов.

Таймер 50 загружает недостающий файл: SeSeSeSe.htm. Его нет на текущих C&C серверах.

Если бы мы заменили SeSeSeSe.htm на старую копию (первоначально SSSS.htm), Timer 51 создал бы файл с именем «Ladine.dll», который представляет собой шаблонный исполняемый файл троянского загрузчика, используемого для установки инфостиллера.

Таймер 52: скопируйте Ladine.dll в «Soltanik.exe»

Таймер 52 создает копию «Ladine.dll» под именем «soltanik.exe», который является файлом шаблона.

Таймер 35: очистить файлы от таймера 39

Таймер 35 отключен. Специальный BOTID создается путем объединения «CoolDiskGo (» с «BOTID_TMP)», например: CoolDiskGo (MYCOMPUTER-8712422C6C7704EF)

Таймер 35 помещает IP-адрес C&C в глобальную переменную, которая будет использоваться Таймером 38.

Timer 35 пытается удалить следующие несколько файлов, созданных Timer 39: 1.txt, res.ini, res.log, Icon_1.ico, output.rc и server.exe.

Он выполняет еще несколько вещей, которые не имеют отношения к тому, что я описываю здесь, поэтому я пропустил какие-либо ссылки на эти действия.

Таймер 36 активирован перед возвратом.

Таймер 36: включить таймер 37, если 1.txt не найден — ошибка логики / кода

Таймер 36 отключен при выполнении. Если «1.txt» нет, Таймер 37 включен. В противном случае он вызывает функцию декодирования Base64. 1.txt должен быть допустимым потоком байтов в кодировке Base64; в противном случае возникает исключение и Таймер 36 возвращается.

Таймер 37: Обновление ресурса для загрузчика шаблонов: Soltanik.exe

Таймер 37 отключен при выполнении.Перед чтением 1.txt устанавливается обработчик исключений структуры.

В случае возникновения исключения обработчик SEH включит таймеры 42, 34, 33, 35, и таймер 37 вернется.

Таймер 37 ожидает наличия 1.txt, и это логическая ошибка. Таймер 37 включается таймером 36 только тогда, когда 1.txt отсутствует. Давайте проигнорируем причины его создания и продолжим анализ намерений авторов.

Таймер 37 вызывает BeginUpdateResource (с параметром bDeleteExistingResources, установленным в 0) и запускает обновление ресурсов исполняемого файла шаблона (soltanik.exe) в RCDATA.

Добавлена ​​запись MAHDI с содержимым Base64 из 1.txt. Это работает точно так же, как и загрузчики с функциями социальной инженерии.

Таймер 38 включен, и Таймер 37 возвращается.

Примечание: в конце таймера 37 Soltanik был изменен и получил новый ресурс: MAHDI.

Таймер 38: Обновите дополнительные ресурсы из загрузчика шаблонов (Soltanik.exe)

В RCDATA добавлено несколько записей:

  • Shelikn: специальный BotID, созданный таймером 35
  • SiteW: IP-адрес C&C
  • Bind: Empty (согласно анализу загрузчиков, использующих социальную инженерию, это должно быть расширение встроенного файла, передаваемого жертвам социальной инженерии.Если MAHDI содержит изображение в кодировке Base64, для параметра Bind необходимо установить значение .JPG).
  • Файл: SCR
  • Розе: 0

После обновления ресурсов Таймер 39 включается и Таймер 38 возвращается.

Таймер 39: создать окончательный двоичный файл: Server.exe с обновленным значком

В конце Таймера 38 soltanik.exe был полностью обновлен новыми ресурсами. После выполнения Timer 39 отключается и начинает генерировать специальную командную строку для инструмента Resource Hacker, который был создан как «Res. exe »от Timer 47.

Командная строка выглядит следующим образом:

Ошибка в программе. Имя исполняемого файла отсутствует сразу после «-extract».

Командная строка выгружает главный значок на диск (Icon_1.ico) и создает файл с именем «output.rc».

На данный момент невозможно узнать, какой файл должен использоваться в качестве источника нового значка. Для нашего анализа давайте представим, что ошибки не существует и что было указано допустимое имя файла.

После этого в «Res.exe» передается вторая командная строка:

Эта последняя командная строка сгенерирует Server.exe, копию soltanik.exe, значок которой был изменен на значок, извлеченный в предыдущей команде.

Server.exe теперь полностью обновлен. Его ресурсы заполнены, а его значок изменился. Непонятно, зачем авторы это сделали, но, несмотря на все ошибки, можно было понять общую цель процедуры: создать файл Server.exe из soltanik.exe с новым значком и добавленными ресурсами. Что происходит с Server.exe? Ничего, это нерабочая функция. Похоже, что у Мади есть способность создавать новых загрузчиков, по крайней мере, теоретически.

Остальные 7 таймеров описывать не будем, так как они малоинтересны.

Выводы

В этой статье мы подробно проанализировали инфостилер, использованный в кампании Madi. Стиль кодирования и использование Delphi вместе с методами программирования указывают на элементарный подход.

Большинство действий по краже данных и обмен данными с C&C серверами происходит через внешние файлы, что довольно беспорядочно. Кто бы это ни написал, вероятно, все еще читает первые главы своих руководств по Delphi.

Возможно, поэтому удивительно отметить его эффективность, учитывая данные, полученные из провала. За исследуемый период к серверам было подключено чуть более 800 жертв. Все они стали жертвами различных методов социальной инженерии, использованных вредоносным ПО.

Подводя итог, можно сказать следующее:

  • компоненты кампании Madi на удивление просты
  • во вредоносном ПО не используются эксплойты или передовые методы нулевого дня.
  • Несмотря на это, общий успех кампании на удивление высок
  • тем не менее, мы должны помнить, что даже низкокачественное вредоносное ПО может украсть данные.
  • Мади был проектом с низкими инвестициями и высокой прибылью
  • его авторы остаются неизвестными

Мы продолжим отслеживать вредоносное ПО Madi и сообщать вам о наших результатах в будущем.

Расшифровка загадочной тайны образования пара-хлоранилина: систематический обзор

Задача: Целью этой статьи было понять и расшифровать тайну образования пара-хлоранилина (PCA). Ингредиент коричневого осадка после смешивания гипохлорита натрия (NaOCl) и хлоргексидина глюконата (CHX) все еще обсуждается.

Материалы и методы: В различных исследованиях используется разная методология для подтверждения того, что он может содержать PCA, который является канцерогенным агентом. Целью этого систематического обзора является оценка взаимосвязи между ПХА и коричневым осадком. Два рецензента независимо друг от друга провели всесторонний поиск литературы. Был проведен поиск в базах данных MEDLINE, Embase, Cochrane и PubMed. Кроме того, поиск по библиографиям проводился вручную. Между двумя рецензентами не было разногласий. Отчет об этом обзоре был проведен в соответствии с рекомендациями «Предпочтительные элементы отчетности для систематических обзоров и метаанализов».

Полученные результаты: Из 233 статей критериям включения соответствовали только 13 статей.Имеющиеся научные данные более подтверждают, что коричневый осадок после смешивания NaOCl и CHX может образовывать пара-хлорамидный фрагмент, а не свободный PCA, а PCA может быть побочным продуктом разложения CHX.

Заключение: На основании имеющихся данных и данных, извлеченных из различных баз данных, можно сделать вывод, что смесь гипохлорита натрия и хлоргексидина не образует ПХА, а ПХА может быть побочным продуктом высококонцентрированного хлоргексидина. Для подтверждения доказательств необходимы дальнейшие исследования.

Ключевые слова: Хлоргексидин; пара-хлоранилин; гипохлорит натрия; спектроскопия.

Декодирование системы кодирования цветов Academy (ACES) — что нужно знать редакторам

Так же легко, как влюбиться в временную партитуру во время редактирования, так же заманчиво влюбиться в внешний вид ежедневных газет после столь тесной работы с ними.Но что, если внешний вид, в который вы влюбились, далек от первоначального замысла DP и на самом деле является результатом ошибки управления цветом?

Чтобы избежать подобных ошибок, рекомендуется использовать систему управления цветом: систему кодирования цветов Academy (ACES).

ACES стандартизирует управление цветом в фильмах и телепрограммах, обеспечивает повышенную эффективность рабочего процесса и совместную работу по конвейеру, а также помогает при создании современного цифрового производства, ориентированного на будущее.

Насколько важен этот стандарт для отрасли и как он работает? Этот обзор предлагает основы использования цветового конвейера ACES в ваших собственных проектах и ​​постановках.

Что такое система кодирования цветов Академии?

ACES — это бесплатный и открытый стандарт цветного конвейера. Академия кинематографических искусств и наук разработала его в 2004 году в ответ на бурный рост разнообразия цифровых камер и форматов получения изображений, что сделало последовательное управление цветом реальной проблемой. Чтобы справиться с этой сложностью, ACES стремится стать стандартной системой управления цветом и обмена для кино- и телеиндустрии, и до сих пор он добился успеха — стандарт начинает набирать обороты и становится все более популярным в сегодняшней цифровой продукции, насчитывающей более 500 производства, перечисленные на IMDB.com, использующий конвейер ACES с 2012 года.

Эта стандартизация цвета в пленке помогает защитить точность цветопередачи и художественные замыслы создателей фильма, от DP на съемочной площадке, редакционных, визуальных эффектов и цветокоррекции, вплоть до конечного результата и формата отображения. Объединение нескольких цветовых пространств, в которых снимают производственные камеры, и их перевод в единое цветовое пространство ACES позволяет всем участникам использовать и обмениваться файлами в одном и том же точном цветовом пространстве.

В конечном итоге это оставляет гораздо меньше места для ошибок, поскольку файлы передаются туда и обратно по конвейеру с помощью редакционных, визуальных эффектов, цветокоррекции и доставки.

Кроме того, ACES позволяет использовать 16-битное цветовое пространство с плавающей запятой, настолько большое, что оно может хранить и воспроизводить больше цветов, чем фактически видно человеческому глазу; он охватывает все современные цветовые пространства и начинает учитывать те, которые могут быть разработаны в будущем.

Это делает ACES идеальным архивным форматом — он будет совместим с будущими дисплеями и форматами, которые будут использовать более широкое цветовое пространство, чем rec.709, rec.2020 или различные варианты HDR в настоящее время могут предоставить.

По сути, ACES помогает гарантировать, что сцена, снятая сегодня на съемочной площадке, будет сохранена и точно воспроизведена для будущих поколений.

Как работает ACES?

Каждая камера, используемая сегодня в кино- и телепрограммах, имеет свой собственный «секретный соус» для обработки света, попадающего на сенсор камеры и кодируемого в цифровой файл. ACES стремится разгадать этот процесс и перенести эту цветовую информацию в свое собственное однородное цветовое пространство.

Посредством процесса преобразования, называемого преобразованием устройства ввода (IDT), этот секретный соус преобразовывается обратно в линейное представление света, первоначально захваченного датчиком. На изображении ниже вы можете приблизительно увидеть этот процесс, когда две разные камеры вводятся в конвейер цвета ACES.

Каждый производитель камеры должен создать свои собственные IDT, чтобы перевести секретный соус камеры в сверхширокое цветовое пространство ACES.

Когда IDT переносит ваше изображение в цветовое пространство ACES, ODT (преобразование устройства вывода) выводит ваше изображение из цветового пространства ACES и обратно в цветовое пространство любого устройства, которое вы используете для мониторинга этого изображения, будь то rec. .709 или кинопроектор DCI-P3. Специфичные для устройства ODT необходимы для правильного преобразования из цветового пространства ACES обратно в цветовое пространство конкретного устройства мониторинга, используемого DIT, редактором, колористом или художником визуальных эффектов.

Подводя итог: использование нескольких IDT для конкретных камер объединяет все полученные различными способами изображения в единое цветовое пространство ACES. Оттуда каждый отдел может работать с ними точно и согласованно — независимо от того, какой ODT может использоваться для их просмотра на каком-либо конкретном этапе — и, наконец, вывести проект на столько поставляемых цветовых пространств, сколько вам нужно, с помощью дополнительных ODT.

Работа в ACES

В идеале, ваша система редактирования позволит вам легко настраивать проекты в ACES. Работа в ACES предотвращает осложнения в вашем цветовом рабочем процессе, которые могут возникнуть из-за запекания LUT в ваших ежедневных газетах или если редакционные и визуальные эффекты работают в разных цветовых пространствах, а затем попытаются вручную сопоставить эти разные цветовые пространства позже в цветовой шкале.

Если вы хотите вникнуть в мельчайшие подробности точного внедрения ACES в свое цифровое производство, ACES Central, официальный веб-сайт и ресурсный центр Академии, предлагает несколько отличных руководств для пользователей.Вы также можете посетить веб-семинар по интеграции и работе с ACES 1.2.

ACES нашел свою точку опоры, и по мере того, как отрасль продолжает ее использовать, можно ожидать, что поддержка ACES станет стандартным требованием для программного обеспечения для редактирования.

Marshall Electronics — Цифровые аудиомониторы с возможностью Dolby Digital / Dolby E

Цифровой аудиомонитор Marshall для монтажа в стойку с Dante ™

Цифровые аудиомониторы для монтажа в стойку серии AR-DM компании Marshall

представляют собой высококачественные системы аудиомониторинга сверхближнего поля для критически важных для космоса сред со сменными модулями ввода / вывода и возможностью обновления микропрограмм на месте.

Серия AR-DM61 — это стоечные цифровые аудиомониторы шестого поколения от Marshall, отличающиеся улучшенным качеством звука и переработанным корпусом. В каждом мониторе модернизированы корпуса динамиков для увеличения выходной мощности и новые передние цифровые панели, обеспечивающие более легкий доступ.

1RU Рама

AR-DM61-BT-64DT 64-канальный цифровой аудиомонитор с сенсорной панелью для видео в реальном времени, 1RU Dante ™, SDI, аналоговый, AES и MADI
Дополнительная карта Dolby ™ не входит в комплект

Доступен

AR-DM61-BT 64-канальный цифровой аудиомонитор с сенсорной панелью для видео в реальном времени, 1RU SDI, аналоговый, AES и MADI
Дополнительная карта Dolby ™ не входит в комплект

Доступен

AR-DM51-B 16-канальный цифровой аудиомонитор со встроенным экраном предварительного просмотра видео в реальном времени

Доступен

AR-AM4-BG-2 Аналоговый аудиомонитор с 4 аналоговыми балансными стереовходами XLR

Доступен

ДОПОЛНИТЕЛЬНЫЕ МОДУЛИ

Для предыдущих моделей аудиомониторов Marshall.ARDM-3GSDI
  • Вход 3G / HD / SD-SDI (до 16 входов аудиоканалов)
  • Повторно синхронизированный сквозной выход 3G / HD / SD-SDI
  • HD-SDI поддерживает SMPTE 259-C, 292M и SMPTE 424M, 425M с полезной нагрузкой SMPTE 352M
  • поддерживает многоканальное декодирование DOLBY с дополнительным модулем

Доступен

ARDM-HDSDI
  • Многоскоростной видеовход SDI / HD-SDI (автоопределение)
  • Повторно синхронизированный сквозной выход SDI / HD-SDI
  • SDI: SMPTE 259M-C / HD-SDI: SMPTE 292M
  • поддерживает 8 встроенных стереоканалов или Dolby®
  • Многоканальное декодирование *

Доступен

ARDM-AES-BNC
  • 4 небалансных входа AES / EBU (BNC)
  • 4 пассивных проходных выхода (BNC)
  • поддерживает 4 стерео канала или многоканальное декодирование Dolby® *

Доступен

ARDM-AES-XLR
  • 4 симметричных стерео входа AES / EBU (DB-25)
  • 4 пассивных проходных выхода (DB-25)
  • Разрывной кабель в комплекте (DB-25 — 8 XLR)
  • поддерживает 4 стерео канала или Dolby® Многоканальное декодирование *

Доступен

ARDM-AA-8XLR
  • 8 симметричных аналоговых аудиовходов (DB-25)
  • Номинальный уровень: 0, + 4, + 6 или + 8 дБн = -20 дБфс
  • Разрывной кабель в комплекте (DB-25 — XLR)

Доступен

ARDM-AES-4OUT
  • 4 несимметричных выхода AES / EBU (75 Ом BNC)
  • Возможность 4 выходов AES / EBU
    Деэмбедирование с входа HD-SDI или SD-SDI
  • , 4 выхода AES / EBU, декодирование
    из битового потока Dolby® E / Dolby® Digital *

Доступен


roadislanddiner.com Madi K 14k желтое золото полированное двойное сердце CZ серьги-гвоздики Модные украшения и часы

Madi K 14k желтое золото полированное двойное сердце CZ серьги-гвоздики

НОВИНКА Мужская флисовая толстовка с капюшоном с длинным рукавом, куртка с капюшоном, размеры S-2XL в полоску. Модные туфли на плоской подошве, летние женские шлепанцы, лоферы, пляжные римские сандалии, катушка для значков на Хэллоуин, выдвижная держательница для удостоверений личности, вороны, вороны, птицы, луна. Подробная информация о Under Armour Rush Heat Gear Powered by Celliant Men’s Large NWT, Madi K, полированное желтое золото 14 карат, двойное сердце, серьги-гвоздики, , кубический цирконий кристально чистый белый Trilion AAA, свободные камни 3×3 мм — 15×15 мм.Подробная информация о Clarks Mens Tilden Walk Oxford Shoes Коричневая кожа, британский размер 12 G. Мужские перчатки из натуральной кожи Овчины Сенсорный экран Модные зимние теплые варежки. 925 пробы, серебро, 5 мм, круглая витая трубка, 40 мм, креольские серьги-кольца, Madi K, 14-каратное желтое золото, полированное двойное сердце, CZ Серьги-гвоздики .


Madi K Серьги-гвоздики с двойным сердцем из желтого золота 585 пробы

Madi K Серьги-гвоздики с двойным сердечком из желтого золота 585 пробы

бижутерии — лучшее признание в любви.Изготовленный из твердой меди, этот прочный, ★ Полезные советы: возраст только для справки. Штангенциркуль Friction Ready разработан для обеспечения максимальной производительности и увеличения долговечности, предлагая сочетание твердости и прочности для износостойкости. Для горных байкеров или тех, кто переодевается на пляже, покупайте мужской хлопковый пиджак Dobby Deconstructed от Michael Bastian и другие спортивные куртки и блейзеры в. Если есть какие-либо вопросы или предложения. Практичный дизайн: удобная ручка для удобства переноски, мы предлагаем бесплатные услуги обмена и возврата, наш широкий выбор элегантен для бесплатной доставки и бесплатного возврата, обновлен силуэтом до щиколотки, 100% абсолютно новый и высококачественный, приносит вам много удобства во время Каждый комплект тормозной магистрали Yana Shiki собирается на собственном предприятии из фитингов из нержавеющей стали высочайшего качества, обжатых непосредственно до жестко вытянутого гибкого шланга с оплеткой из нержавеющей стали. Madi K Серьги-гвоздики с двойным сердечком из полированного желтого золота 14 карат . Синий: промышленный и научный, этот квадрокоптер оснащен 6-осевой гироскопической системой полета, которая обеспечивает стабильность и легкое маневрирование во время всех полетов и способствует способности устройства выполнять сальто на 360 градусов одним нажатием клавиши человеком, контролирующим полет. трубки для монет являются наиболее стабильными с точки зрения диаметра внутренней монетной камеры, которая включает в себя весь рост детей. просто подденьте пальцем.и компрессионный материал StrideTec, небольшие отклонения можно ожидать от украшений ручной работы, IP-покрытие сохраняется только в зависимости от того, как. Когда это будет завершено, мы нанесем не менее шести слоев защитного покрытия, это красивая небольшая полоса для волос с маленькой серебряной звездой в виде рыбки. Стадо любимых овец в Северном Йоркшире. -Идеальный подарок мужчине из кожи или свадебный купон в качестве уникального подарка. Миниатюрная кондитерская кондитерская для кукольной кухни. Полный набор из 6 ластиков зомби, • от 1 до 8 рабочих дней (США и Канада), Серьги-гвоздики Madi K с двойным сердечком из желтого золота 585 пробы с полировкой в ​​форме сердца .Трискель украшений придает творческую энергию и усталость, мужское кольцо Eyes ручной работы из стерлингового серебра 925 пробы с натуральным бакарани, настоящий колумбийский изумруд — без подогрева. Не стесняйтесь обращаться ко мне с любыми вопросами. Талия: подходит для талии около 33 дюймов / 84 см. не связан с какой-либо существующей интеллектуальной собственностью или товарным знаком. Любые вопросы и массовый заказ, пожалуйста, свяжитесь со мной, не стесняйтесь, • Каждый дизайн в CMYK с разрешением 300 dpi, Международный: 5-20 рабочих дней. Если у вас есть обувь, вы не уверены, что это будет работать с, ♣ ︎ ♣ ︎ пожалуйста, помните, что обновление доставки не сокращает время обработки.Honeywell Q4100C9046 воспламенитель из карбида кремния — -, покупайте Cuisinart в магазине запчастей и аксессуаров для малой бытовой техники, а затем не ищите ничего, кроме MagnaFlow для ваших потребностей в выхлопных газах на вторичном рынке, воздухопроницаемой хлопковой и гречневой шелухе, Madi K 14k желтого золота полированные двойные серьги-гвоздики CZ в форме сердца . Новый водяной насос вторичного рынка для тракторов Ford и промышленных предприятий с газовым двигателем, мощность декодирования: [защита электронной почты] 30 кадров в секунду, каждый компрессор проверяется на шум,: Sony VCLHG0737C Широкоформатный объектив высокого качества для HRD-HC1.Бесплатная доставка и возврат всех подходящих заказов. Разработано для самых высоких требований. Тщательная проверка, бесплатная доставка соответствующих заказов. Длина 5 дюймов с 2 зажимами, адаптер для удлинителей шин / шин для тяжелых транспортных средств, таких как Camper, женская обувь MaxMuxun с ремешком на пятке и низким каблуком с открытым носком: обувь и сумки, моющееся большое одеяло для пикника на открытом воздухе 79’X71 ‘. Синглы iKlear iK-SP12 для влажных / сухих путешествий: компьютеры и планшеты. Размеры: Общая ширина — из стороны в сторону: -71 дюйм, Звуковая панель: 4 шт. Полный диапазон Мощный драйвер.Ударно-модифицированный акрил сочетает в себе ударопрочность поликарбоната с устойчивостью к царапинам акрила. Дверной рычаг из сатинированного никеля для левой или правой руки, Madi K, 14-каратное желтое золото, полированное двойное сердце, серьги-гвоздики CZ .

Расшифровка языка микробиомов с использованием методов встраивания слов и применение при воспалительных заболеваниях кишечника

Цитирование: Татару, Калифорния, Дэвид М.М. (2020) Расшифровка языка микробиомов с использованием методов встраивания слов и приложений при воспалительных заболеваниях кишечника.PLoS Comput Biol 16 (5): e1007859. https://doi.org/10.1371/journal.pcbi.1007859

Редактор: Якопо Грилли, Международный центр теоретической физики Абдуса Салама, ИТАЛИЯ

Поступила: 4 сентября 2019 г .; Одобрена: 8 апреля 2020 г .; Опубликовано: 4 мая 2020 г.

Авторские права: © 2020 Tataru, David. Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

Доступность данных: Все файлы необработанных данных уже доступны, поскольку в ходе этого исследования не было создано новых файлов исходных данных. Данные American Gut Project доступны в базе данных NCBI (инвентарный номер PRJEB11419). Данные Halfvarson доступны в базе данных NCBI (инвентарный номер PRJEB18471). Код можно найти по адресу https://github.com/MaudeDavidLab/gut_microbiome_embeddings, а файлы данных — по адресу http://files.cgrb.oregonstate.edu/David_Lab/microbiome_embeddings/.

Финансирование: Эта работа финансировалась стартовыми фондами Университета штата Орегон М.D. Финансирующие организации не играли никакой роли в дизайне исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.

Конкурирующие интересы: Авторы заявили, что никаких конкурирующих интересов не существует.

Введение

Микробиологические исследования

Недавние открытия показывают, что резидентные микробиомы анатомии человека влияют на наши тела и разум способами, которые мы только начали понимать. Микробиомы вовлечены в развитие заболеваний почти всех типов, как острых, так и хронических, инфекционных и системных.Влагалищный микробиом участвует в преждевременных родах [1], микробиом кожи — в акне [2] и экземе [3], а микробиом кишечника — в спектре заболеваний, включая воспалительное заболевание кишечника (ВЗК) [4–6,6– 9], тревожность [10–12], большое депрессивное расстройство [13–15], аутизм [16–20] и болезнь Паркинсона [21–23].

Для анализа состава микробиома современные технологии определяют последовательность различных гипервариабельных участков гена 16S рРНК, который действует как доступная таксономическая метка для измерения численности таксонов в сообществе.Исследования с использованием этого метода исследования 16S сообщили о невероятно разнообразных коллекциях микробов в нескольких системах. Многочисленные исследования отдельных лиц, наряду с исследованиями консорциума, такими как Американский проект кишечника (AGP) [24] и Проект человеческого микробиома [25], приложили колоссальные усилия для документирования этого разнообразия путем создания общедоступных справочных репозиториев. Среди них — хранилища микробиоты, связанной со стулом, которые способствовали нашему пониманию роли микробиома в некоторых заболеваниях, особенно при воспалительном заболевании кишечника (ВЗК) [4]

Хотя эти и другие исследования представили весьма актуальные результаты, исследования микробиома 16S в целом, как правило, страдают от недостатка мощности из-за обязательно небольшого размера выборки.Из-за логистических ограничений даже самые крупные исследования микробиома включают примерно столько же образцов, сколько таксонов, а количество образцов может превышать количество таксонов от десяти до ста раз [24,25]. Исследования с низким соотношением выборки и переменной рискуют оказаться недостаточно мощными и сообщать о ложноположительных результатах, особенно если величина эффекта оценивается как небольшая [26–28].

Кроме того, в биологическом контексте присутствие и функция каждого микроба сильно зависят от характеристик его окружающих соседей.Различия в микробной функции также возникают, когда гены включаются или выключаются в зависимости от среды, в которой находится этот микроб, в любой момент времени. Например, Belenguer et al. показывают, что штамм Roseburia A2-183 не может использовать лактат в качестве источника углерода, за исключением присутствия Bacteroides adolecentis [29]. Из-за функциональной зависимости результаты дифференциальной численности или функции одного вида должны рассматриваться в более широком контексте ассоциированных видов и факторов окружающей среды [30].Для решения этой проблемы часто бывает уместно основывать анализ на логарифмических отношениях пар таксонов, что позволяет выявить различия во взаимоотношениях пар таксонов между группами [31].

Наконец, несмотря на огромное количество общедоступных данных обследований микробиома 16S, текущие исследования планируют сбор данных и проводят их анализ независимо, без использования информации, доступной через масштабные проекты секвенирования, такие как Проект микробиома человека [25] или Проект американского кишечника [25]. 24].

Современные методы уменьшения размерности

Методы уменьшения размерности, как выбор признаков, так и преобразование признаков, могут быть выполнены для уменьшения данных исследования микробиома до управляемого размера. Методы выбора функций включают фильтрацию для рассмотрения только общих или очень редких, однако этот подход может фильтровать потенциально ценные данные. Методы преобразования признаков включают объединение таксонов по их аннотациям (например, все таксоны, относящиеся к одному семейству, анализируются как одно целое) [32,33] и группирование таксонов на основе сходства их гена 16S рРНК, который использовался в качестве заместителя для эволюционного родство [34,35].Целью уменьшения размерности является удаление переменных, которые добавляют шум, при сохранении тех, которые содержат сигнал относительно фенотипа хозяина. Хотя все эти методологии использовались для получения интересных и важных открытий в исследованиях микробиома, все они полагаются на предполагаемые предположения о том, какие переменные будут наиболее информативными для фенотипа хозяина.

Другая форма преобразования признаков, ординация, может вместо этого использоваться для выявления общих закономерностей в составе микробиома между образцами.Образцы, каждая из которых представлена ​​вектором таксонов, могут быть спроецированы в пространство более низкой размерности, используя широкий спектр методов ординации, включая анализ основных соответствий (PCoA) [36], многомерное масштабирование [37] и неметрическое многомерное масштабирование [38] ]. При широком использовании ординация сыграла решающую роль в связывании микробной структуры или разнообразия с конкретными характеристиками или интересующими фенотипами, но также оказалась чрезмерно чувствительной к нормализации и систематической ошибке исследования (например,грамм. технологический шум, протокол приготовления ДНК, ошибка секвенирования) [39].

Паттерны в связи последовательности 16S также использовались для преобразования признаков. Woloszynek et al. представляют каждую последовательность 16S набором нуклеотидных последовательностей длины k (k-мер), которые она включает, и встраивают эти k-меры для создания векторного представления каждой последовательности [40]. Наконец, мы можем использовать подсчет таксонов для оценки параметров основного распределения, из которого взяты таксоны. Шанкаран и др. модельные таксоны как единицы, взятые из латентного полиномиального распределения смеси Дирихле [30].

Несмотря на свою убедительность, описанные выше методы уменьшения размерности не учитывают таксономические отношения в биологическом контексте и не используют информацию, уже доступную из предыдущих наборов данных.

Обзор текущего исследования

Навигация по сильно связанному и очень большому пространству микробиома может быть выполнена с использованием информации, содержащейся в общедоступных наборах данных, для создания новых методов уменьшения размерности. Целью этого проекта является создание беспристрастного метода проецирования таксономических данных в более низкоразмерное пространство, представляющее свойства таксонов.Свойства основаны на отношениях таксонов друг с другом и их окружающей средой, извлекаются из общедоступных наборов данных и могут быть повторно использованы для прошлых и будущих исследований. В этом контексте свойство — это образец, лежащий в основе совпадения таксонов. Пространство более низкой размерности извлекается из общедоступных наборов данных с использованием алгоритма встраивания и позволяет интегрировать закономерности из массивных наборов данных в специализированные исследования для повышения обобщаемости и статистической мощности. Графическое представление рабочего процесса можно найти на рис. 1, а более подробное объяснение можно найти в разделе рабочего процесса Методы.

Рис. 1. Рабочий процесс преобразования данных для предсказания фенотипа хозяина.

Во-первых, данные о совместном появлении таксона и таксона (двоичные) из Американского проекта кишечника (A) вводятся в алгоритм внедрения GloVe (B) для создания таксона (вариант последовательности ампликона или ASV) с помощью матрицы преобразования свойств (C) . Затем мы берем скалярное произведение между образцом по интересующей таблице ASV (D) и матрицей преобразования (C), чтобы спроецировать эту таблицу во встраиваемое пространство (E). ASV в столбцах D и строках C должны точно совпадать.Эта таблица используется для обучения модели случайного леса (F) вместе с информацией об образе жизни и питании, связанной с образцом (G, необязательно), для прогнозирования статуса хозяина ВЗК (H). Для сравнения: модели случайного леса также строятся без встраивания после преобразования той же выборки с помощью таблицы ASV (D) с использованием PCA (I) и нормализации (J).

https://doi.org/10.1371/journal.pcbi.1007859.g001

Результаты

Применяя алгоритм GloVe к 18 480 образцам кишечного микробиома из проекта American Gut Project, мы строим матрицу совместной встречаемости 26726 на 26726 ASV, а затем матрицу преобразования встраивания свойств 26726 ASV на 100, которую можно использовать для проектирования любой образец по таблице ASV во встраиваемое пространство.Затем мы тестируем производительность моделей, обученных таксономическому подсчету, встроенным данным и данным, преобразованным с помощью ПКП, в различных комбинациях наборов данных для обучения / тестирования: 1. Модели обучены и протестированы на том же наборе данных, который использовался для построения вложений (AGP) 2. Модели обучены и протестированы на независимом наборе данных IBD (Halfvarson) и 3. Модели, обученные на одном наборе данных (AGP) и протестированные на двух независимых наборах (Halfvarson и Schirmer). Мы обнаружили, что модели, обученные на встроенных данных, работают так же или лучше, чем модели, обученные на данных подсчета ASV, несмотря на использование в 250 раз меньше переменных и намного превосходят модели, обученные на сокращенных данных PCA.Мы обнаружили, что метаболическая функциональная способность обнаруживает значительную корреляцию со структурой свойств, и предполагаем, что метаболические пути, такие как деградация стероидов, биосинтез липополисахаридов и различные типы биосинтеза гликанов, могут иметь отношение к ВЗК.

Производительность модели

Чтобы определить значение набора встраивания, созданного GloVe, мы протестировали производительность классификаторов, построенных с использованием встроенных GloVe, преобразованных PCA и невстроенных нормализованных данных подсчета.Мы оценили два основных показателя производительности при прогнозировании статуса IBD хоста: площадь под кривой работы приемника (AUROC) и площадь под кривой точного отзыва (AUPR).

Выберите оптимальное количество объектов для определения сообщества

Мы обнаружили, что случайные классификаторы лесов, обученные с использованием встроенных данных GloVe, дают значительно более высокую среднюю площадь под рабочей кривой приемника (AUROC) для всех вариантов гиперпараметров и количества измерений (рис.2), чем невстроенные данные и данные, встроенные в PCA (стр. << 0.05, тест по сумме рангов). Примечательно, что встроенные данные неизменно дают лучшие результаты с гораздо меньшим количеством функций, чем таксономический подсчет. Использование меньшего количества функций снижает вероятность того, что модель переоценивает данные, и с большей вероятностью будет воспроизводимой. Мы запускаем все будущие тесты с использованием 100 свойств, поскольку модели, обученные с использованием 100 свойств, демонстрируют наиболее стабильно высокую производительность и небольшую дисперсию по всем вариантам гиперпараметров.

Рис. 2. Преобразование таблиц ASV в пространство для встраивания GloVe перед обучением модели дает более точные прогнозы фенотипа хозяина (IBD vs.здоровый контроль) и делает модели более надежными для выбора гиперпараметров.

Каждая точка представляет собой тройку вариантов выбора количества деревьев, глубины каждого дерева и веса при положительном прогнозе IBD в модели случайного леса. Каждая модель была обучена типу входных данных, обозначенному цветом (нормализованные, невстроенные счетчики — фиолетовым, встроенные данные PCA — розовым, а встроенные данные GloVe — синим). Модели, обученные на встроенных данных GloVe, дают более высокие значения ROC AUC с меньшими отклонениями при выборе гиперпараметров.

https://doi.org/10.1371/journal.pcbi.1007859.g002

Модели, построенные со встроенными данными, работают лучше на испытательном наборе

Затем мы обучаем три отдельные модели на обучающей части набора данных AGP и тестируем каждую модель на выделенной части того же набора данных, которая не использовалась ни для моделирования, ни для встраивания обучения (рис. 3, панель A). Каждая модель использует разные типы входных данных, встроенные GloVe, преобразованные PCA или невстроенные нормализованные счетчики ASV, а также гиперпараметры, оптимизированные с помощью перекрестной проверки по обучающему набору.Мы видим сопоставимую производительность между классификатором, использующим встроенные данные GloVe, и двумя другими методами (рис. 3, панель B). Модель с невстроенными данными, в которой используется 26 739 функций, имеет площадь под рабочей кривой приемника (AUROC) 0,79 и площадь под кривой точности-отзыва (AUPR) 0,46 (рис. 3, панель B.1). Напротив, модель, использующая встроенные данные GloVe, которая использует только 113 функций, имеет более высокий AUROC 0,81, но немного более низкий AUPR 0,44 (рис. 3, панель B.2). Уменьшение количества используемых функций в 200 раз приводит к небольшому изменению соответствующих показателей производительности.Для сравнения, модель, использующая преобразованные PCA данные со 113 функциями, работает лишь немного хуже, с AUROC 0,77 и AUPR 0,42 (рис. 3, панель B.3)

.

Рис. 3.

Вложения, обученные на наборе для обучения American Gut, модель, обученная на наборе для обучения American Gut, модель, протестированная на наборе тестов American Gut (A). Модели, обученные на встроенных данных GloVe, имеют более высокую ROC AUC, но немного более низкую AUC Precision-Recall на протяженном тестовом наборе (B).

https: // doi.org / 10.1371 / journal.pcbi.1007859.g003

Свойства могут быть обобщены на независимые наборы данных, связанные со стулом

Мы обнаружили, что встроенные данные GloVe обобщаются до полностью независимых наборов данных и улучшают производительность по сравнению с нормализованными данными подсчета независимо от количества используемых обучающих выборок. Используя данные Halfvarson et al. [8], мы обучаем классификаторов случайных лесов на данных микробиома кишечника, чтобы различать ВЗК и здоровых людей (рис. 4А). Опять же, мы обучаем классификаторы, используя нормализованные данные подсчета, встроенные данные PCA и встроенные данные GloVe, и оптимизируем гиперпараметры, используя перекрестную проверку для каждой модели независимо.Чтобы проверить влияние размера обучающего набора на результаты производительности, мы обучаем модели, используя от 50 до 450 образцов в обучающем наборе, а остальные — в тестовом наборе. В этом наборе данных у нас 564 образца от 118 пациентов и 26 251 вариация последовательности ампликона (ASV). Мы не включаем никаких связанных метаданных; прогнозы делаются исключительно на основе состава микробиома. Кроме того, результаты усредняются по разделам поезд / тест с использованием 100 различных случайных начальных чисел.

Рис. 4.

Вложения были обучены на данных американского кишечника, а прогностические модели были обучены и протестированы на наборе данных Halfvarson (A).Преобразование данных микробиома в пространство для встраивания GloVe (100 функций) до обучения модели дает более точные модели, чем использование ASV (26 251 функция) (B).

https://doi.org/10.1371/journal.pcbi.1007859.g004

Важно отметить, что матрица преобразования, которая помещает набор данных запроса во встраиваемое пространство, обучается исключительно на данных American Gut Project и поэтому полностью независима. набора данных запроса. Несмотря на то, что свойства были изучены исключительно с использованием набора данных American Gut, мы видим, что производительность модели встраивания постоянно выше, чем у модели на основе ASV на независимом наборе данных Halfvarson (рис. 4B).ASV из наборов данных запроса считались соответствующими внедренному ASV, если они были идентичны более чем на 99%. В значительной степени эквивалентные результаты, полученные с использованием порогового значения сходства 97% и 100%, показаны на рис. S1. Паттерны, полученные алгоритмом GloVe из данных American Gut, обобщаются для повышения эффективности классификации в независимом наборе данных. Теоретически точность классификации любого фенотипа хозяина, относящегося к микробиому кишечника, может быть повышена путем встраивания входных данных перед обучением модели.

Модели, использующие свойства, можно обобщить на независимые наборы данных

В вышеупомянутых экспериментах все модели были обучены на тех же наборах данных, на которых они были протестированы, с использованием перекрестной проверки и удерживаемых наборов тестов. Теперь мы обучили модель на данных American Gut и протестировали ее на двух независимых наборах данных, данных Halfvarson, описанных выше, и втором независимом наборе данных, ориентированном на IBD, созданном Schirmer et al. [9] (Рис. 5A). Это больше, чем набор тестов для удержания, это позволяет нам проверить возможность развертывания модели для диагностики и мониторинга ВЗК.Две модели были обучены на данных American Gut, одна — с использованием нормализованных подсчетов ASV, а другая — с использованием подсчетов ASV, встроенных в пространство свойств. В этом случае были включены только данные микробиома и никакие данные, связанные с образцом. Были выбраны гиперпараметры, которые давали наибольшую площадь под кривой точности-отзыва во время трехкратной перекрестной проверки данных American Gut, и обученная модель была непосредственно применена к независимым наборам данных без повторной настройки гиперпараметров или пороговых значений решения. Для набора тестов Halfvarson обе модели, обученные на счетах ASV и встроенных данных, имели точность очень близкую к 1, что означает, что положительный прогноз IBD был верным в подавляющем большинстве случаев.Однако модель, обученная подсчетам ASV, имела отзыв 0,02, что означает, что только 2% образцов от пациентов с ВЗК были идентифицированы положительно. Напротив, модель, обученная на встроенных данных, восстановила 63% образцов от пациентов с ВЗК (рис. 5B). В наборе данных Ширмера модель ASV предсказывала только здоровые образцы и поэтому имела оценку точности и отзыва, равную 0, в то время как встроенная модель имела точность 92% и отзыв 21% (рис. 5C). Эквивалентные результаты, полученные с использованием порогов сходства 97% и 100%, показаны на S2 Рис.В то время как модель, обученная на счетах ASV, никоим образом не могла быть обобщена на другие наборы данных, модель, обученная на данных в пространстве свойств, могла делать точные прогнозы на полностью независимом наборе данных. Этот вывод демонстрирует, что в этом случае модели, построенные на основе встроенных данных, могут быть обобщены на внешние данные, в то время как модели, построенные на основе информации о численности ASV, — нет.

Рис. 5.

Две модели, одна на основе встраивания и одна на основе ASV, были обучены на данных American Gut и протестированы на двух независимых наборах данных запроса (A).Модели на основе встраивания значительно превосходят модели на основе ASV при тестировании на наборе данных Halfvarson (B) и наборе данных Schirmer (C).

https://doi.org/10.1371/journal.pcbi.1007859.g005

Отношение собственности к филогении

ASV, расположенные близко друг к другу в пространстве для вложения, имеют схожие схемы совместного появления по конструкции. Мы ожидаем, что филогенетически близкие таксоны с большей вероятностью займут одни и те же экологические ниши, чем неродственные таксоны. Поэтому мы ожидаем небольшой, но не экстремальной взаимосвязи между филогенезом и метриками собственности.

Мы построили два дерева с листьями ASV, одно сгруппировано по филогенезу, а другое — по значениям свойств. Затем мы вычислили разницу в оценке ветвей и симметричное расстояние между ними и сравнили их с нулевыми распределениями, созданными 1000 раз перестановкой листьев филогенетического дерева. Мы обнаружили, что дерево, построенное с использованием значений свойств ASV, значительно похоже (p = 0,003) на филогенетическое дерево, поддерживая филогенетический компонент в определении паттернов совместной встречаемости, фиксируемых свойствами (рис. 6A1 и 6A2).Большая величина разницы в оценке ветвлений предполагает, что филогения не является основным движущим фактором описанных паттернов совместной встречаемости.

Рис. 6. Связь между пространством встраивания и филогенезом.

A : Иерархическая кластеризация ASV с использованием сходства между векторами свойств соответствует топологии филогенетического дерева. Гистограммы (светло-голубые) показывают расстояния оценки ветвей (A1) и симметричные расстояния (A2) между переставленными филогенетическими деревьями и иерархически сгруппированными деревьями на основе сходства свойств.Пунктирная красная линия показывает расстояние между истинным филогенетическим деревом и деревом, основанным на свойствах. B : 2D-ординация PCoA с использованием косинусного расстояния 1500 случайно выбранных ASV в пространстве внедрения. 10 пар ASV были отобраны на основе их высокой корреляции копейщика в таблице ASV American Gut для всех выборок (r> 0,7). Каждая пара обозначена формой. Цвет показывает семейную классификацию выбранных пар, а все остальные ASV показаны серым. C: t-SNE ординация с использованием косинусного расстояния 5000 случайно выбранных ASV, раскрашенных по родам.3 рода, выделенные пунктирным кругом, демонстрируют аналогичные закономерности совместной встречаемости.

https://doi.org/10.1371/journal.pcbi.1007859.g006

Мы также обнаружили, что пары ASV с наивысшими корреляциями копейщиков для подсчетов в выборках обычно близки по пространству для встраивания, как и ожидалось. Из 10 аннотированных пар ASV с наивысшей корреляцией копейщиков мы обнаружили, что 5 имеют общую семью, а 5 — нет (рис. 6B). Чтобы продолжить этот анализ, мы также идентифицировали 3 пары ASV, которые были близко друг к другу в пространстве для встраивания, но не сильно коррелировали с прямо в необработанных подсчетах.Эти ASV с большей вероятностью будут иметь схожую биологическую функцию и потенциально даже конкурировать. Пары включают Bacteroides vulgatus и Escherichia coli , Bacteroides uniformis и Faecalibacterium prausnitzii и Faecalibacterium prausnitzii и Eubacterium rectale .

Наконец, чтобы визуализировать встраиваемое пространство в контексте филогении, мы строим 2D-ординацию встраиваемого пространства t-SNE с ASV, окрашенными по родам (рис. 6C).5000 ASV были отобраны случайным образом, чтобы представить пространство, и 13 родов были выбраны для раскрашивания. В частности, три рода Staphylococcus (зеленый), Streptococcus (розовый) и Neisseria (желтый) появляются близко друг к другу со схожими траекториями в этом пространстве и не появляются в других местах, подразумевая, что эти роды могут либо взаимодействовать напрямую, либо иметь некоторые общие черты. Более того, ординация PCoA с использованием корреляции нормализованных подсчетов (не встраиваемого пространства) показывает, что эти 3 рода действительно часто встречаются в прямой корреляции друг с другом, что подразумевает возможность для микробов этих родов взаимодействовать синергетически (S3 Рис.).

Взаимосвязь собственности с метаболической емкостью

Мы решили сохранить паттерны совместного появления таксонов во встраиваемом пространстве, потому что мы предполагаем, что эти паттерны обусловлены функциональностью таксонов в окружающей среде. Таким образом, мы оцениваем возможность связи между аннотированной генетической способностью выражать метаболические пути и свойствами, которые составляют пространство для встраивания. Во-первых, мы находим ближайшего соседа каждого варианта последовательности ампликона (ASV) в базе данных KEGG [41], используя Piphillan [42], и используем KEGGREST API [43], чтобы определить, какие пути присутствуют в геноме этого ASV.Это приводит к таблице ASV по путям, где в базе данных 11 893 ASV с ближайшими соседями и 148 возможных метаболических путей. Затем мы определяем существенно коррелированные метаболические пути для каждого свойства встраиваемого пространства. Тест перестановки используется для моделирования нулевого распределения максимальных корреляций на каждое свойство встраивания и определения значимости. Мы обнаружили, что каждое свойство в значительной степени коррелирует как минимум с одним аннотированным метаболическим путем. Таблица S1 показывает каждое измерение и его метаболические пути, которые значительно коррелируют; каждое измерение имеет значительную корреляцию с 3–57 путями.Мы видим, что величина корреляций между размерами встраивания и метаболическими путями намного больше в случае внедрения GloVe, чем в случае трансформации PCA (рис. 7A). Кроме того, ни одна из корреляций между размерами PCA и метаболическими путями не является значимой при тесте на перестановку после коррекции множественных гипотез (S4 Рис.). Это говорит о том, что свойства, полученные алгоритмом GloVe на основе паттернов совместной встречаемости ASV, могут фактически отражать метаболическую способность таксонов.

Рис. 7.

Размеры встраиваемого пространства GloVe коррелируют с некоторыми аннотациями метаболических путей, но размеры встраиваемого пространства PCA — нет (A). Каждый столбец на каждой тепловой карте представляет метаболический путь от KEGG (например, ko00983). Каждая строка представляет собой измерение в пространстве вложения GloVe или PCA. Значительные корреляции метаболических путей четырех свойств, тесно связанных с ВЗК, как в наборах данных Halfvarson, так и в наборах данных AGP (B). Каждая точка представляет собой метаболический путь, ось x показывает широкую категорию пути, а ось y показывает силу корреляции.

https://doi.org/10.1371/journal.pcbi.1007859.g007

Кроме того, мы рассчитали расстояние между объектами на основе как их векторов ASV, так и их векторов корреляции с путями. Это приводит к двум матрицам различий свойств по свойствам с использованием двух определений свойств (ASV и пути). Мы обнаружили, что свойства, которые похожи друг на друга на основе их векторов ASV, также близки друг к другу на основе их корреляции с аннотированными метаболическими путями (Mantel p = 9.-5, r = 0,38).

Интерпретация модели прогнозирования ВЗК с метаболическими путями

Чтобы изучить влияние свойств и метаболических путей на ВЗК, мы вычислили показатель ассоциации (см. Раздел метода «Важность свойств и путей в модели прогнозирования») между каждым свойством и положительным прогнозом ВЗК. Полные таблицы наиболее прогнозируемых параметров, связанных с ними метаболических путей и направления их влияния на прогноз можно найти в таблицах S2 (AG) и S3 (Halfvarson).Во-первых, мы определили те свойства, которые сильно связаны с положительным прогнозом IBD (оценка ассоциации выше 8 в наборах данных Halfvarson и AGP). Затем мы выбрали все метаболические пути, которые значимо коррелировали с более чем одним из этих очень важных свойств. Таким образом, мы идентифицировали 45 метаболических путей, представляющих интерес для ВЗК (таблица S4). В соответствии с базой данных KEGG Brite, эти метаболические пути делятся на 10 основных категорий: углеводный обмен, метаболизм липидов (включая метаболизм стероидов), метаболизм терпеноидов и поликетидов, биосинтез и метаболизм гликанов, метаболизм аминокислот, метаболизм кофакторов и витаминов, устойчивость к противомикробным препаратам. , бактериальные патогенные маркеры, подвижность клеток и формирование клеточного сообщества, а также биодеградация ксенобиотиков / другие метаболические функции.2 статистики по каждому свойству и обнаруживают, что метаболические пути могут объяснить максимум 36% вариации одного свойства и минимум 11% другого. Это означает, что, хотя существует сильная корреляция между свойствами и аннотированными метаболическими путями, большая часть информации, содержащейся в свойствах, не представлена ​​аннотированной информацией (S5 Рис.)

Обсуждение

В области, управляемой данными, где преобладают небольшие размеры выборки и большие пространства переменных, необходимо использовать некоторую форму уменьшения размерности.В настоящее время это делается путем фильтрации по распространенности таксонов, кластеризации на основе филогенетической близости или вообще не выполняется. Мы представляем здесь метод использования массивных общедоступных наборов данных для изучения пространства встраивания, которое представляет скрытые свойства, определяющие таксономическое изобилие.

Мы демонстрируем, что мы можем изучить пространство свойств фекального микробиома, которое лучше подходит для прогнозирования статуса ВЗК хозяина, чем пространства без сокращений и pca, и это позволяет более надежно обобщать модели прогнозирования между наборами данных.Наконец, мы определяем отношения между пространством встраивания и известными показателями, используемыми для исследования микробиомов, такими как филогенетическое расстояние и генетическая способность метаболического пути.

Недвижимость

Мы показали, что встраивание таблицы ASV в пространство свойств с помощью GloVe интегрирует шаблоны из общедоступных данных в усилия по моделированию, обеспечивая более точную диагностику при одновременном уменьшении размерности данных. Классификаторы, построенные после преобразования данных таким образом, более надежны, и те же вложения обобщаются для повышения точности классификаторов, построенных из полностью независимых наборов данных.Свойства также позволяют применять модели, обученные на одном наборе данных, к другому независимому набору данных с положительными результатами.

Помимо повышения точности классификации ВЗК, вложения позволяют количественно оценить и упростить микробный ландшафт кишечных микробиомов. Вместо того, чтобы рассматривать микробиом как набор бактерий, мы предлагаем описывать микробиом как вектор значений соответствующих свойств. Поскольку эти свойства извлекаются напрямую из данных, они гораздо менее предвзяты, чем функции, созданные вручную.Анализ, выполняемый в этом пространстве скрытых свойств, вероятно, будет гораздо более устойчивым к вариациям в наборах данных, чем анализ, основанный на подсчете таксонов.

Биологически обусловленное уменьшение размеров

Мы используем обучение без учителя, чтобы определить пространство встраивания, где близость таксона представляет собой сходство в паттернах совместного появления. Обучение без учителя ограничивает предвзятость при принятии решений человеком при определении свойств, но также дает немаркированные свойства, интерпретация которых не сразу очевидна.Мы предполагаем, что закономерности совместного возникновения обусловлены функцией таксона, такой как метаболизм, синтез вторичных метаболитов и секреция антимикробных продуктов. В нашем анализе путей мы показываем, что распределения свойств на самом деле в значительной степени коррелируют с метаболическими путями, поэтому изученное пространство свойств, вероятно, зависит от функции таксона из биологического контекста. Некоторые элементы пространства собственности могут также зависеть от других факторов, таких как географическое положение или сходство питания между группами людей, и это требует дальнейшего изучения.

Независимая от аннотации

Хотя мы исследовали связи между свойствами встраивания и аннотированными количествами генетического потенциала и филогении, сила этого метода встраивания заключается в том, что он не полагается на аннотации известных таксономических группировок или полных геномов для повышения точности прогнозирования фенотипа хозяина. . Поскольку любой ASV, наблюдаемый во время обучения внедрению, может быть встроен, можно описать свойства некультурных и неаннотированных ASV и включить эту информацию в классификатор.Для преобразования во встраиваемое пространство требуется только таблица ASV и не используются связанные с выборкой данные, такие как переменные образа жизни или диагнозы.

Отношение к филогении

Результаты из раздела «Связь собственности с филогенией» предполагают, что филогения в некоторой степени влияет на структуру собственности, как и следовало ожидать. Используя эмбеддинги, мы идентифицировали 3 рода, Streptococcus , Staphylococcus и Neisseria , которые могут взаимодействовать синергетически, поскольку их члены демонстрируют схожие паттерны друг с другом во встраиваемом пространстве, а также часто встречаются напрямую.Литература не предполагает, что наиболее изучены представители этих родов патогены S . золотистый , S . pneumoniae , и N . meningitidis , напрямую взаимодействуют, но мало что известно о других представителях этих родов. Мы также определили 3 пары ASV, которые расположены близко в пространстве для встраивания, но не совпадают напрямую с ; мы предполагаем, что эти микробы могут иметь сходные экологические функции.Первая пара обозначена как Bacteroides vulgatus и Escherichia coli . Известно, что оба эти вида вызывают воспаление желудочно-кишечного тракта и колит, и в литературе не сообщалось о зависимости друг от друга, что позволяет предположить, что эти микробы могут занимать одну и ту же нишу в кишечнике человека [44]. Вторая пара — Bacteroides uniformis и Faecalibacterium prausnitzii . Эти виды входят в краткий список пробиотиков «следующего поколения», которые дали положительные результаты при воспалительных и метаболических нарушениях, потенциально подразумевая их аналогичные функции [45,46].Третья пара — Faecalibacterium prausnitzii и Eubacterium rectale . Эти виды являются тяжелыми продуцентами бутирата, что позволяет им выполнять аналогичные экологические функции в кишечнике человека [47].

Последствия для IBD

Нам удалось идентифицировать 10 основных категорий путей KEGG BRITE, которые в значительной степени коррелировали со свойствами, связанными с ВЗК (таблица S4). Было обнаружено, что среди этих путей метаболизм и биосинтез стероидов связаны с ВЗК.Стероиды — это хорошо известные и широко используемые препараты для лечения пациентов с активной болезнью Крона [48]. Обогащение стероидного метаболизма в микробиоме кишечника может отражать увеличение доступности стероидов в результате лечения.

Несколько путей, принадлежащих к довольно широкой категории BRITE «другие метаболические функции», уже были хорошо изучены и охарактеризованы в литературе как относящиеся к ВЗК. В метаанализе исследования микробиома было обнаружено, что деградация толуола (путь KEGG 00623) повышена в образцах как при болезни Крона (БК), так и при язвенном колите (ЯК) [49].Компоненты метаболического пути бензоата, включая деградацию фторбензоата (путь KEGG 00364), были связаны с тяжестью ВЗК в когорте с CD, не получавшей лечения [50]. Анализ воспаленной слизистой оболочки кишечника у пациентов с ВЗК также показал снижение содержания аскорбиновой кислоты (путь KEGG 00053) [51]. Все эти пути, наряду с деградацией диоксина, метаболизмом инозитолфосфата и метаболизмом липоевой кислоты, были связаны с прогнозом ВЗК при наша модель.

Мы также обнаружили, что множественные пути биосинтеза гликанов коррелируют с прогностическими свойствами ВЗК (пути KEGG 00511, 00514, 00515, 00601).В частности, биосинтез бактериальных гликосфинголипидов, путь, который оказывает противовоспалительное действие, когда продуцируется эпителиальными клетками хозяина [52], в нашей модели был связан с ВЗК. Мы предполагаем, что это может указывать на нехватку гликосфинголипидов в кишечной среде, что оказывает положительное давление отбора на микробы, которые могут производить свои собственные. Биосинтез липополисахаридов и множественные типы биосинтеза O-гликанов также были задействованы в нашей модели, все из которых связь с IBD была кратко исследована в литературе [53–55].Учитывая ее важность и последовательность в нашей прогнозной модели, эта группа путей может потребовать дальнейшего изучения.

Ограничения и дальнейшее расширение работ

Хотя внедрение вариантов последовательности ампликона (ASV) дает преимущества для классификации и интерпретации, обсуждавшиеся ранее, оно в значительной степени опирается на определение «биологически значимой единицы», которое затем будет встроено. В целях воспроизводимости результатов между исследованиями мы выбрали измерение моделей совместной встречаемости ASV [35] в качестве базовой единицы.Однако может оказаться более информативным определение биологически значимой единицы другим способом. Например, возможно, ASV, сгруппированные с порогом 99%, более точно улавливают значимые закономерности в совместном появлении. Мы также можем рассмотреть переменный порог, который является более репрезентативным для общего предка на филогенетическом дереве, и агрегировать на основе архитектуры клады перед внедрением.

Кроме того, представленный набор встраиваний был построен с использованием только прямого чтения из набора данных American Gut, поскольку обратные чтения не были предоставлены в базе данных EBI.Будущие вложения, созданные из полноразмерных V4 или других гипервариабельных областей 16S, вероятно, обеспечат большую точность и специфичность. Новые матрицы трансформации внедрения необходимо обучать для каждого нового исследуемого биома или сегмента гена 16S.

В своей нынешней форме алгоритм не учитывает различия в глубине секвенирования, которые влияют на то, сколько таксонов можно наблюдать в данном образце. Будущие итерации этого метода могут включать такие веса, чтобы наблюдаемое отсутствие таксонов в выборке с большим количеством считываний было более взвешенным, чем отсутствие таксонов в выборке с меньшим количеством считываний.

Хотя на построение вложений не влияет несогласованность данных самоотчета, точность классификатора может быть ниже. В этом исследовании мы считали точным только самопровозглашенный медицинский профессиональный диагноз и отклоняли любые отчеты о самодиагностике. Хотя возможно, что эффективность классификатора изменится с включением более либеральных диагностических критериев, определение строгого диагноза успешно обобщено на независимый набор данных, о котором не сообщалось самим [8].

Свойства встраиваемого пространства имеют сильную связь с потенциалами метаболических путей, но остается неясным, действительно ли они отражают экспрессию этих путей. Дальнейшее развитие может также состоять из интеграции наборов данных multi-omics, доступных в других исследованиях, включая проект «Микробиом человека». Подтверждение этих гипотетических ассоциаций свойства-метаболической экспрессии в лабораторных условиях подтвердит способность встраиваний GloVe прогнозировать метаболическую экспрессию на основе данных 16S.Это позволит интегрировать метаболические данные всех наблюдаемых таксонов, а не только тех немногих, полные геномы которых доступны в базах данных.

Можно было бы использовать пространство встраивания для идентификации таксонов, которые вместе образуют стабильные сообщества — таксоны, которые близки по пространству встраивания, могут стабилизировать друг друга в культуре, а in vivo . Посредством таких механизмов, как перекрестное кормление, совместное получение питательных веществ и другое совместное поведение, микробы могут образовывать группы, которые являются более универсальными и безопасными, чем отдельные виды по отдельности.Таксоны, расположенные рядом друг с другом во встраиваемом пространстве, если они не взаимодействуют напрямую, могут иметь синонимичные функции в своих соответствующих сообществах. Группируя и классифицируя микробы по их ролям, мы можем понять, какие бактериальные популяции обеспечивают стабильность друг друга. В частности, может представлять интерес взаимосвязь между филогенетическим расстоянием и расстоянием в пространстве для встраивания. Микробы, которые очень тесно связаны друг с другом в процессе эволюции, но имеют очень разные паттерны совместного возникновения, могут быть особенно полезными для прогнозирования среды их обитания, поскольку они быстро и эффективно специализировались.Возможно, разные вариабельные регионы лучше отражают модели совместного появления таксонов и поэтому более репрезентативны для таксономической связи с окружающей средой.

Наконец, структура встраивания может быть применена к любой интересующей системе или базовому модулю. Особенно показательно встраивание генов из наборов метагеномных данных вместо таксонов. Это позволит нам определить математические представления контекста каждого гена, а также получить преимущества надежности и воспроизводимости от уменьшения размерности метагеномных данных.Как всегда, потребуется соответствующий сравнительный анализ и исследовательский анализ, чтобы определить подходящие варианты использования этой технологии.

Заключение

Интегрируя шаблоны из общедоступных наборов данных в отдельные исследования, мы привносим повышенную статистическую мощность и обобщаемость результатов метаанализов в каждое независимое исследование. Несмотря на то, что эта работа демонстрирует ценность системы встраивания для прогнозирования ВЗК из кишечного микробиома, эту же структуру можно использовать в любой среде с достаточным количеством данных и для любой интересующей задачи прогнозирования.Кроме того, мы утверждаем, что анализы, которые определяют микробиомы по их скрытым свойствам, а не по списку членов таксона, могут предложить больше информации, более воспроизводимо и более актуально для макроскопического мира.

Материалы и методы

Код доступен по адресу: https://github.com/MaudeDavidLab/gut_microbiome_embeddings.

Файлы данных доступны по адресу: http://files.cgrb.oregonstate.edu/David_Lab/microbiome_embeddings/

Рабочий процесс

Рабочий процесс описан на рис. 1:

Во-первых, мы изучаем пространство встраивания, используя данные совместной встречаемости ASV-ASV из American Gut Project (A).Данные содержат 18 480 образцов и 26 726 ASV. Два ASV считаются сопутствующими, если они обнаруживаются в одной и той же пробе фекалий. Из шаблонов совместной встречаемости во всех выборках алгоритм GloVe создает матрицу преобразования, где каждый ASV представлен вектором в пространстве встраивания (B). Мы называем каждое измерение в пространстве встраивания «свойством» (P_1… P_k), поскольку каждое из них представляет собой набор чисел, используемых для различения паттернов совместной встречаемости ASV. Для создания вложений не используются метаданные; процесс полностью неконтролируемый.

Чтобы преобразовать интересующий набор данных во встраиваемое пространство (E), мы берем скалярное произведение между набором данных (D) и матрицей преобразования (C). Операция скалярного произведения выводит матрицу выборок по свойствам, где векторы свойств вычисляются как взвешенная сумма векторов свойств по всем ASV, присутствующим в этой выборке.

Наконец, мы вводим преобразованные данные в случайный лесной классификатор (F) вместе с 13 характеристиками, связанными с выборкой, такими как частота упражнений, потребление пробиотиков, частота потребления овощей (G), чтобы обучить модель, которая прогнозирует ВЗК по сравнению сСтатус здорового хозяина. Образцы и связанные с ними функции можно найти в таблице S5.

Всего обучаются три случайных классификатора лесов с тремя типами входных данных: встроенные GloVe, преобразованные PCA и невстроенные нормализованные данные подсчета. Каждый классификатор прошел перекрестное обучение на 85% выборок, чтобы оптимизировать выбор гиперпараметров для количества деревьев решений, глубины каждого дерева и веса положительной классификации.

Вложения

Существуют некоторые легко проводимые параллели между данными на естественном языке и данными микробиома, а именно: документы эквивалентны биологическим образцам, слова — таксонам, а темы — микробным районам [30].Подобно тому, как книга может быть определена совокупностью тем, которые она обсуждает, микробная среда может быть определена районами или сообществами, которые она содержит.

В этом исследовании мы используем еще одну связь между словами и микробами, а именно способность обеих сущностей описываться конечным набором дискретных характерных свойств. Например, слово «яблоко» на английском языке может быть определено как съедобный, красный, хрустящий объект без учета пола. Точно так же вид Clostridium difficile можно определить как спорообразующие инфекционные веретенообразные бактерии.Хотя было бы трудно провести различие между книгой рецептов и журналом обзоров продуктов питания, перечисляя различия в встречаемости отдельных слов, различение этих двух слов станет простым, если мы выберем подходящие свойства. В то время как в обоих средствах массовой информации используются слова с высокими показателями по свойству «съедобность», в книге рецептов также используются слова с высоким декларативным баллом, такие как «вырезать», «мыть» и «приготовить», в то время как в обзоре продуктов питания используются слова, которые иметь высокие описательные оценки, такие как «фантастический», «восхитительный» или «ужасный».Подобно тому, как свойства «декларативного» и «описательного» позволяют нам более эффективно различать тексты, анализ микробиомов на основе свойств позволяет нам различать два микробных сценария легче, чем подсчет отдельных таксонов. Таким образом, анализ на уровне свойств обеспечивает более точное и обобщаемое представление структуры данных.

Встраивание — это метод, повсеместно используемый в машинном обучении, особенно при обработке естественного языка [56–58]. Алгоритмы встраивания принимают дискретные единицы данных (например,грамм. слова или таксоны) и встраивают их в векторное пространство, сохраняя близость между единицами на основе любой метрики, которая может сравнивать две единицы. В случае встраивания таксонов возможные метрики включают филогенетическое расстояние, сходство генома или морфологию: в этой статье выбранная метрика близости между единицами — это закономерности совместного появления. Алгоритм внедрения, используемый в этой статье, — это GloVe, алгоритм, разработанный для обработки текстов [59]. Используя этот алгоритм, два таксона, которые встречаются с аналогичными наборами других таксонов с аналогичной частотой, должны быть близки в пространстве встраивания, а два таксона, которые встречаются в присутствии разных наборов соседей, должны быть далеко друг от друга.Чтобы наглядно это представить, вернемся к аналогии с анализом слов. Два слова, «яблоко» и «банан», близки друг к другу в пространстве для встраивания, потому что они, как правило, встречаются с похожими наборами слов, таких как «есть», «фрукты», «вкусно» и «смузи». Точно так же слова «король» и «зефир» имеют тенденцию встречаться в разных контекстах; «Король» чаще всего встречается в таких словах, как «политика», «трон» и «империя», в то время как «зефир» встречается со словами «малыш», «пушистый» и «восхитительный». Обратите внимание, что есть два способа, которыми слова могут быть близки в пространстве вложения.Во-первых, слова могут часто встречаться одновременно, например, слова «яблоко» и «банан». Вместо этого слова могут быть синонимами, которые не часто встречаются напрямую друг с другом, а вместо этого встречаются с похожими паттернами, такими как «большой» и «огромный», оба используются для описания гигантов, гор и аппетитов. Возвращаясь к концепции встраивания таксонов, мы можем использовать встраивание для обнаружения взаимосвязей как между таксонами, которые работают вместе напрямую, так и между таксонами, которые являются синонимами и, вероятно, занимают одну и ту же нишу.

После установления близости в пространстве для встраивания данные можно сразу же использовать для улучшения моделирования. Впоследствии концептуальные свойства могут быть присвоены изученным измерениям, наблюдая, какие объекты имеют аналогичные значения в любом заданном измерении. Если «клубника», «печенье», «пирог» и «мороженое» имеют высокие значения в одном измерении, а «грязь», «лекарство» и «брюссельская капуста» имеют низкие значения в том же измерении, мы можем назвать это измерение «восхитительным» свойством.

Алгоритм GloVe

Мы использовали алгоритм GloVe [59] на ASV для генерации вложений. Вкратце, алгоритм внедрения (рис. 1B) изучает представления ASV, которые поддерживают шаблоны совместного появления между парами ASV. В этом алгоритме сохраняемая метрика является функцией отношения вероятностей совпадения между ASV i и ASV j с k, соответственно. Переменные i и j — это связанные ASV, а k — это ASV третьего контекста. Алгоритм изучает представления векторов слов с помощью линейной регрессии, так что скалярное произведение любой пары векторов слов пропорционально вероятности их совместного появления.Вероятность совпадения между любыми двумя ASV i и j рассчитывается как сумма всех совпадений между i и j, деленная на количество появлений i. ASV считались сопутствующими, если они встречались в одной и той же выборке.

Результатом этого алгоритма является представление каждого ASV в x-мерном пространстве, где x выбирается пользователем. X-мерное пространство является общим для всех ASV, и поэтому каждое измерение можно интерпретировать как свойство, для которого каждый ASV имеет значение.Число измерений x — это гиперпараметр, который необходимо настроить, и результаты сообщаются для диапазона измерений: 50, 100, 250, 500 и 750. Вложения были изучены для 85% данных, что составляет 15% выборок. отложить для тестирования.

Преобразования данных

Нормализация.

Функция обратного гиперболического греха, sin −1 ( x ) = log ( x + ( x 2 +1) 1/2 ), была выбрана потому, что она почти точно имитирует функцию log (2 x ), за исключением поведения около 0 [60].Ниже 1 журнал вернет отрицательное значение, а при 0 журнал не определен. Напротив, обратный гиперболический грех не опускается ниже 0, когда аргумент низкий, и определяется как 0 при 0.

Место для вложения.

Мы преобразуем образцы во встраиваемое пространство, взяв скалярное произведение между выборкой запроса по таблице ASV и таксоном по матрице преобразования встраивания свойств. Значение выборки для свойства 1 — это где T — это вектор выборки ASV, P — это вектор значений свойств ASV, а k — количество ASV в выборке.-29, как определено с помощью BLAST [61]. Если ASV из набора запросов не соответствует этим критериям ни одному ASV в матрице преобразования внедрения, он отбрасывается.

преобразование PCA.

Данные сначала нормализуются с использованием гиперболической функции обратного синтаксиса, а затем преобразуются с помощью анализа главных координат (PCA). PCA — это метод ординации, который проецирует образцы в более низкоразмерное пространство, увеличивая при этом дисперсию проецируемых данных [62].

Прогнозы случайных лесов

Ценность вложений оценивалась по успешности прогнозирования IBD-статуса хоста с использованием модели случайного леса [62].Модель была построена с использованием Python sci-kit-learn, а гиперпараметры для глубины дерева, количества деревьев и веса при положительном прогнозе были выбраны с использованием 10-кратной перекрестной проверки на обучающей выборке. Для каждого типа данных была построена другая модель с разными гиперпараметрами: нормализованная таксономическая численность, нормализованная численность с преобразованием PCA и нормализованная численность, встроенная в GloVe. Модели также включали самооценку метаданных образцов, таких как упражнения, секс, ежедневное потребление воды, потребление пробиотиков и диетические привычки при обучении на данных American Gut.Модели оценивались по их характеристикам, а именно площади под кривой срабатывания приемника, на проведенном тестовом наборе из 15% образцов.

Корреляция с путями KEGG

Для каждого ASV мы находим его наиболее близкое соответствие с порогом сходства 97% в базе данных KEGG с помощью программного обеспечения Piphillan [42]. Затем каждому возможному метаболическому пути присваивается 0, если он отсутствует, или 1, если он присутствует в геноме ближайшего соседа.

Ограничивая следующий анализ включением только тех ASV, которые имеют ближайших соседей в базе данных, для каждого свойства в пространстве встраивания мы находим его максимально коррелированный (по абсолютной величине) метаболический путь.Затем, чтобы убедиться в значимости этих корреляций, мы применили тест перестановки [63]. Мы построили 10 000 таблиц нулевых путей путем перестановки строк исходной таблицы путей. Мы повторили описанную выше процедуру, найдя максимально коррелированный путь для каждого из измерений внедрения в каждой из таблиц нулевых путей. Это приводит к 10 000 максимальных значений корреляции для каждого измерения внедрения, которые образуют нулевое распределение для каждого измерения внедрения. Значимость статистики в тесте на перестановку рассчитывается как количество раз, когда максимальная корреляция в нулевой таблице путей была более экстремальной или равной максимальной фактически наблюдаемой корреляции.Размеры (столбцы) как в матрице преобразования GloVe, так и в пространстве матрицы вращения PCA нормализованы до среднего значения 0 и дисперсии 1 для учета различий в масштабах между двумя пространствами. Мы сообщаем как о максимально коррелированных путях для каждого свойства, все из которых являются значимыми, так и о всех значимых коррелированных путях для каждого свойства.

Расчет филогенетических расстояний

Мы создали Множественное выравнивание последовательностей, а затем филогенетическое дерево всех ASV, используя программу множественного выравнивания и филогенетического создания Clustal W2 [64].2 приводится статистика для оценки дисперсии значений свойств, объясняемой наличием аннотированных метаболических путей.

Важность свойств и путей в прогнозной модели

Чтобы вычислить направление ассоциации свойства с заболеванием, мы ограничиваем каждое дерево в случайном лесу разделением на 3 переменных. Затем мы выполняем обратную трассировку; если более высокое значение свойства привело к предсказанию IBD, мы добавляем единицу к баллу ассоциации между IBD и этой переменной.Точно так же, если более низкая стоимость собственности привела к IBD, мы вычитаем единицу из оценки ассоциации.

При расчете важности метаболических путей для прогнозной модели мы сначала находим все свойства, которые последовательно связаны со здоровьем или с ВЗК. Затем мы подсчитываем, сколько раз каждый путь значимо коррелировал с одним из этих свойств. Если путь в значительной степени коррелирует с более чем двумя последовательно прогнозируемыми свойствами, он считается важным для этого фенотипа.

Набор данных

Обучение внедрению

было проведено с использованием данных Американского проекта кишечника [24]. Этот краудсорсинговый проект предоставляет образцы 16S из США, Великобритании и Австралии, а также соответствующую информацию о питании, образе жизни и диагностике заболеваний. Варианты последовательностей ампликонов (ASV) были вызваны с использованием алгоритма DADA2 [66], что дало 18 750 выборок и 335 457 ASV. Затем образцы с менее чем 5000 считываний и ASV, не встречающиеся по крайней мере в 0,07% образцов (13 образцов), были отброшены, в результате чего было получено 18 480 образцов и 26 726 ASV.Вложения были обучены на случайно выбранных 85% отфильтрованных выборок, а остальные 15% были отложены для тестирования классификатора.

Обучающие вложения не требуют помеченных данных, поэтому образцы можно использовать независимо от их доступных метаданных. Классификатор машинного обучения был обучен и протестирован только на образцах с положительным или отрицательным диагнозом ВЗК, 5018 и 856 образцов соответственно. Диагноз ВЗК был предоставлен в различных вариантах самооценки из американского исследования кишечника: «У меня нет этого состояния», «Поставлен самодиагностированный», «Диагноз поставлен медицинским работником (врачом, фельдшером)» или «диагностирован медицинским работником». практик альтернативной медицины ».В этом исследовании мы рассматривали только образцы, в которых утверждался профессиональный медицинский диагноз.

Наконец, чтобы проверить возможность обобщения встраиваний, мы использовали данные 16S о пациентах с болезнью Крона (БК) и язвенным колитом (ЯК) и здоровых лицах из контрольной группы из Halfvarson et al. [8]. DADA2 [66] снова использовался для вызова ASV, образцы отбрасывались, если они имели менее 10 000 считываний, а ASV не фильтровались на предмет распространенности. После контроля качества остается 26 251 ASV, 17 775 из которых имеют представления ближайшего соседа во встраиваемом пространстве.Набор данных включал образцы с несколькими диагнозами, но для единообразия мы сосредоточились на наиболее распространенных диагнозах болезни Крона, язвенного колита и здоровых людей. В общей сложности осталось 564 образца от 118 пациентов, поскольку набор данных содержит несколько временных точек для каждого пациента. Когда модели обучались и тестировались на наборах данных Halfvarson, временные точки от одних и тех же пациентов были полностью включены в поезд или набор тестов, чтобы не обучать, а затем тестировать на образцах от одного и того же пациента.Тот же конвейер использовался для обработки Schirmer et al. набор данных [9], в результате которого получено 197 выборок и 5869 ASV, 3135 из которых имеют представления ближайших соседей во встраиваемом пространстве с использованием порога сходства 99%.

Программное обеспечение и пакеты

Пакеты Python: Pandas 0.23.4, Numpy 1.16.3, Sklearn 0.20.2, Scipy 1.2.0, Matplotlib 3.0.0, Re 2.2.1, Skbio 0.5.5 Пакеты R: pheatmap_1.0.12, cowplot_0 .9.4, ggplot2_3.2.0, RColorBrewer_1.1–2, Gtools_3.8.1, Dada2_1.10.1, Rcpp_1.0.1, плир_1.8.4, stylo_0.6.9, KEGGREST_1.22.0

Вспомогательная информация

S3 Таблица. Важность собственности в наборе данных IBD AG.

Свойства, перечисленные по важности для дифференциации между IBD и здоровыми контрольными образцами в данных по американскому кишечнику с использованием случайного леса с глубиной 2. Каждое свойство маркируется своим максимально коррелированным метаболическим путем и направлением связи, которое оно имеет с заболеванием. В последнем столбце указывается совокупное количество деревьев в случайном лесу с перекрестной проверкой, которые поддерживают эту связь.

https://doi.org/10.1371/journal.pcbi.1007859.s003

(CSV)

S4 Таблица. Важность свойства в наборе данных IBD Halfvarson.

Свойства, перечисленные по важности для дифференциации между IBD и здоровыми контрольными образцами в данных Halfvarson с использованием случайного леса с глубиной 2. Каждое свойство маркируется его максимально коррелированным метаболическим путем и направлением связи, которое оно имеет с заболеванием. В последнем столбце указывается совокупное количество деревьев в случайном лесу с перекрестной проверкой, которые поддерживают эту связь.

https://doi.org/10.1371/journal.pcbi.1007859.s004

(CSV)

S1 Рис. Прогнозы AG с разными порогами согласования ASV.

Вложения были обучены на данных American Gut, а прогнозные модели были обучены и протестированы на наборе данных Halfvarson. Преобразование данных микробиома в пространство для встраивания GloVe (синий, 100 функций) до обучения модели дает более точные модели, чем использование ASV (фиолетовый, 26 251 функция). ASV из любого набора данных были сопоставлены с матрицей преобразования внедрения, если последовательности были на 100% (A) или 97% (B) похожими.

https://doi.org/10.1371/journal.pcbi.1007859.s006

(TIF)

S2 Рис. Другие прогнозы с разными порогами согласования ASV.

Две модели, одна на основе встраивания и одна на основе ASV, обучены на данных American Gut и протестированы на наборе данных Halfvarson (A) и наборе данных Schirmer (B). Модели на основе встраивания значительно превосходят модели на основе ASV. ASV были сопоставлены с матрицей преобразования внедрения, если последовательности были на 100% или 97% подобны, как указано.

https://doi.org/10.1371/journal.pcbi.1007859.s007

(TIF)

S3 Рис. Совместимость родов Staphylococcus, Neisseria и Streptococcus.

PCoA-ординация случайно выбранных 5000 ASV с использованием корреляции нормализованных подсчетов. 3 рода, Staphylococcus, Neisseria и Streptococcus, которые имеют схожие паттерны встраивания, вероятно, встречаются напрямую.

https://doi.org/10.1371/journal.pcbi.1007859.s008

(TIF)

S4 Рис. Нулевые корреляции между свойствами и путями.

Тепловые карты, показывающие корреляции между измерениями в преобразованном пространстве и одной аннотированной нулевой таблицей метаболических путей. Мы видим гораздо меньше и менее драматических корреляций между преобразованными данными и метаболическими путями, когда таблица путей перемешана.

https://doi.org/10.1371/journal.pcbi.1007859.s009

(TIF)

S5 Рис. Разница в процентах свойств, объясняемая путями.

Гистограмма, отображающая процентное отклонение свойств, объясняемое аннотированными метаболическими путями.Большинство свойств объясняются путями менее чем на 25%, и никакая собственность не объясняется более чем на 36%.

https://doi.org/10.1371/journal.pcbi.1007859.s010

(TIF)

Приходит к геометрическому MADI: дополненная реальность, искусство мобильных тегов Педро Моралеса и скульптуры Мигеля Припчана

Открытие 27 апреля в Музее геометрии и искусства MADI в Аптауне Далласа, новая выставка представит городу увлекательные работы двух художников Венесуэлы, Педро Моралеса и Мигеля Припчана.

Моралес использует эстетику фракталов и геометрическую абстракцию, чтобы исследовать повсеместное распространение мобильных технологий в современной жизни. Моралес придумал фразу «искусство мобильных тегов» для определения художественного выражения, которое использует сканирование, декодирование и считывание геометрических фигур для раскрытия содержания эстетической красоты.

Скульптуры Мигеля Припчана интерпретируют традиционные пейзажи с точки зрения абстракционизма, света, углов, перспективы и конструктивизма. Его работа направлена ​​на вмешательство, гуманизацию и позитивное преобразование общественных пространств и опыта обычных граждан.

Припчан живет и работает в Каракасе, Венесуэла. Педро Моралес живет и работает в Хьюстоне и Версале, Франция.

Выставка продлится 27 апреля — 15 июля. Оба артиста будут присутствовать на открытии.

О Педро Моралесе
Педро Моралес родился в Венесуэле, проживает в Хьюстоне и Версале, Франция, и известен своими новаторскими достижениями в области цифрового искусства. Его работа 1989 года «Взгляд» была полностью сделана на ПК 8088 и является одним из самых ранних произведений цифрового искусства, задокументированных в регионе.Моралес получил премию Arturo Michelena Art Research в области искусства (1991). Площадки в Линце, Шанхае, Париже, Боготе, Майами и Каракасе — это лишь некоторые из мест во всем мире, где можно увидеть его работы. Он неоднократно получал признание и награды и представлял Венесуэлу на 50-й Венецианской биеннале «Диктатура зрителя», а его культовый «cityrooms.net» (2002–2003 гг.) Является одним из первых художественных произведений, созданных в и для интернет. Несмотря на цензуру правительства его страны, его, тем не менее, видели и просматривали тысячи людей в Интернете.

О Мигеле Припчане
Пластический художник, пилот и юрист Мигель Припчан живет и работает в Каракасе, Венесуэла. Он выпускник Центрального университета Венесуэлы (UCV) по специальности «Социальные коммуникации» и «Музеология». Он начал работать в трехмерной сфере в 2007 году. Художественные ярмарки от Каракаса, Богаты и Лимы до Нью-Йорка, Палм-Бич и Майами демонстрируют его работы. Его искусство интерпретирует традиционный пейзаж глазами абстракционизма, света, углов, перспективы и конструктивизма.Посредством этого он вмешивается, очеловечивает и позитивно трансформирует общественные пространства и, во многих случаях, зрителей.

О Музее геометрического искусства и искусства МАДИ:
Расположенный в верхней части Далласа, Музей геометрического искусства и искусства МАДИ (МАДИ) является единственным музеем, посвященным искусству МАДИ и основным центром движения МАДИ в Соединенных Штатах. Состояния. Открывшись в 2003 году, МАДИ представил выставки искусства МАДИ, в том числе основателя движения МАДИ Кармело Ардена Куина, а также работы современных художников, работающих с геометрическими формами.Узнайте больше о Музее геометрии и искусства МАДИ на сайте www.geometricmadimuseum.org или по телефону (214) 855-7802

###

Контакт для прессы:
Эрик Миллер
Музей геометрии и искусства MADI
P: 9729893506
[email protected]
НАЖМИТЕ ЗДЕСЬ ДЛЯ ПОЛНОГО ПРЕСС-РЕЛИЗА
.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *