• ми

Валідація моделі видобутку даних проти традиційних методів оцінки віку серед корейських підлітків та молодих людей

Дякуємо за відвідування Nature.com. Версія браузера, який ви використовуєте, має обмежену підтримку CSS. Для найкращих результатів ми рекомендуємо використовувати нову версію вашого браузера (або вимкнути режим сумісності в Internet Explorer). Тим часом, щоб забезпечити постійну підтримку, ми показуємо сайт без стилізації або JavaScript.
Зуби вважаються найбільш точним показником віку людського організму і часто використовуються в оцінці криміналістичного віку. Ми мали на меті підтвердити оцінку стоматологічного віку на основі видобутку даних, порівнюючи точність оцінки та класифікаційні показники 18-річного порогу з традиційними методами та оцінками віку на основі даних. Всього від корейських та японських громадян у віці від 15 до 23 років було зібрано 2657 панорамних рентгенограм. Вони були розділені на навчальний набір, кожен з яких містить 900 корейських рентгенограм, і внутрішній тестовий набір, що містить 857 японських рентгенограм. Ми порівнювали точність класифікації та ефективність традиційних методів з тестовими наборами моделей видобутку даних. Точність традиційного методу на внутрішньому тестовому наборі дещо вища, ніж у моделі видобутку даних, і різниця невелика (середня абсолютна помилка <0,21 років, середня квадратна помилка кореня <0,24 роки). Класифікаційна ефективність для 18-річного відсічення також схожа між традиційними методами та моделями видобутку даних. Таким чином, традиційні методи можуть бути замінені моделями видобутку даних під час проведення криміналістичного віку за допомогою зрілості другого та третього молярів у корейських підлітків та молодих людей.
Оцінка стоматологічного віку широко застосовується в криміналістичній медицині та педіатричній стоматології. Зокрема, через високу кореляцію між хронологічним віком та розвитком зубів, оцінка віку за стадіями розвитку зубів є важливим критерієм для оцінки віку дітей та підлітків1,2,3. Однак для молодих людей оцінка стоматологічного віку на основі зрілості зубів має свої обмеження, оскільки ріст зубів майже завершено, за винятком третьих молярів. Юридична мета визначення віку молоді та підлітків - надати точні оцінки та наукові докази того, чи досягли вони віку більшості. У медико-правовій практиці підлітків та молодих людей у ​​Кореї віку оцінювали за методом Лі, а законний поріг 18 років прогнозував на основі даних, повідомлених OH et al. 5.
Машинне навчання - це тип штучного інтелекту (AI), який неодноразово вивчає та класифікує велику кількість даних, вирішує проблеми самостійно та керує програмуванням даних. Машинне навчання може виявити корисні приховані візерунки у великих обсягах даних6. На відміну від цього, класичні методи, які є трудомісткими та трудомісткими, можуть мати обмеження при роботі з великими обсягами складних даних, які важко обробити вручну7. Тому нещодавно було проведено багато досліджень, використовуючи новітні комп'ютерні технології для мінімізації помилок людини та ефективно обробляти багатовимірні дані8,9,10,11,12. Зокрема, в аналізі медичних зображень широко застосовується глибоке навчання, і повідомлялося про різні методи оцінки віку шляхом автоматичного аналізу рентгенограм для підвищення точності та ефективності вікової оцінки13,14,15,16,17,18,19,20 . Наприклад, Halabi et al 13 розробили алгоритм машинного навчання на основі згорткових нейронних мереж (CNN) для оцінки вікна скелета за допомогою рентгенограм дитячих рук. Це дослідження пропонує модель, яка застосовує машинне навчання до медичних зображень та показує, що ці методи можуть підвищити діагностичну точність. Лі та ін. Вони виявили, що модель CNN глибокого навчання показала ті ж вікові показники, що і традиційна регресійна модель. Дослідження Guo et al. [15] оцінило ефективність класифікації вікової толерантності до технології CNN на основі стоматологічних ортофото, і результати моделі CNN довели, що людина перевершила свою вікову класифікацію.
Більшість досліджень оцінки віку за допомогою машинного навчання використовують методи глибокого навчання13,14,15,16,17,18,19,20. Оцінка віку, заснована на глибокому навчанні, повідомляється, що є більш точною, ніж традиційні методи. Однак такий підхід дає мало можливостей представити наукову основу для вікових оцінок, таких як вікові показники, що використовуються в оцінках. Існує також юридичний спір щодо того, хто проводить інспекції. Тому оцінка віку, заснована на глибокому навчанні, важко прийняти адміністративними та судовими органами. Обробка даних (DM) - це методика, яка може виявити не лише очікувану, але й несподівану інформацію як метод виявлення корисних кореляцій між великими кількостями даних6,21,22. Машинне навчання часто використовується в майнінгу даних, і як обмін даними, так і машинне навчання використовують однакові алгоритми ключів для виявлення шаблонів у даних. Оцінка віку за допомогою розробки зубів заснована на оцінці екзаменатора зрілості зубів -мішеней, і ця оцінка виражається як етап для кожного цілі. DM може бути використаний для аналізу кореляції між стадією стоматологічної оцінки та фактичним віком і має потенціал для заміни традиційного статистичного аналізу. Тому, якщо ми застосовуємо методи ДМ до оцінки віку, ми можемо реалізувати машинне навчання в криміналістичному віці, не турбуючись про юридичну відповідальність. Було опубліковано кілька порівняльних досліджень щодо можливих альтернатив традиційним ручним методам, що використовуються в криміналістичній практиці, та методів на основі EBM для визначення стоматологічного віку. Shen et al23 показали, що модель DM є більш точною, ніж традиційна формула камер. Галібург та ін. Застосували різні методи DM для прогнозування віку за критерієм Демірдджіана25, і результати показали, що метод ДМ перевищував методи Демірдджіана та Віллемса в оцінці віку французької популяції.
Для оцінки стоматологічної епохи корейських підлітків та молодих людей метод 4 Лі широко використовується в корейській криміналістичній практиці. Цей метод використовує традиційний статистичний аналіз (наприклад, множинна регресія) для вивчення взаємозв'язку між корейськими суб'єктами та хронологічним віком. У цьому дослідженні методи оцінки віку, отримані за допомогою традиційних статистичних методів, визначаються як "традиційні методи". Метод Лі - це традиційний метод, і його точність підтвердила Oh et al. 5; Однак застосовність вікової оцінки на основі моделі DM в корейській криміналістичній практиці все ще сумнівна. Нашою метою було науково підтвердити потенційну корисність вікової оцінки на основі моделі DM. Метою цього дослідження було (1) порівняти точність двох моделей DM в оцінці стоматологічного віку та (2) для порівняння класифікаційних показників 7 моделей DM у віці 18 років з тими, що отримують за допомогою традиційних статистичних методів зрілість другого і третій моляри в обох щелепах.
Засоби та стандартні відхилення хронологічного віку на стадії та типу зубів відображаються в Інтернеті в додатковій таблиці S1 (навчальний набір), додаткова таблиця S2 (внутрішній набір тестів) та додаткова таблиця S3 (зовнішній набір тестів). Значення KAPPA для надійності внутрішньо- та Interobserver, отриманих з навчального набору, становили 0,951 та 0,947 відповідно. Значення P та 95% довірчі інтервали для значень KAPPA показані в Інтернет -додатковій таблиці S4. Цінність Kappa трактується як "майже ідеальна", що відповідає критеріям Landis та Koch26.
Порівнюючи середню абсолютну помилку (MAE), традиційний метод трохи перевищує модель DM для всіх статі та у зовнішньому наборі тестів чоловіків, за винятком багатошарового перцептора (MLP). Різниця між традиційною моделлю та моделлю DM на внутрішньому тестовому наборі MAE становила 0,12–0,19 років для чоловіків та 0,17–0,21 року для жінок. Для зовнішньої тестової батареї відмінності менші (0,001–0,05 років для чоловіків та 0,05–0,09 років для жінок). Крім того, середня квадратна помилка (RMSE) трохи нижча, ніж традиційний метод, з меншими відмінностями (0,17–0,24, 0,2–0,24 для внутрішнього тестового набору чоловіків та 0,03–0,07, 0,04–0,08 для зовнішнього тестового набору). .). MLP показує трохи кращу продуктивність, ніж одношаровий перцептор (SLP), за винятком у випадку зовнішнього тестового набору. Для MAE та RMSE зовнішній набір тестів оцінює вище, ніж внутрішній тестовий набір для всіх статей та моделей. Всі MAE та RMSE показані в таблиці 1 та на рисунку 1.
MAE та RMSE традиційних та регресійних моделей видобутку даних. Середня абсолютна помилка MAE, root середня квадратна помилка rmse, одношаровий perceptron slp, багатошаровий перцептрон MLP, традиційний метод CM.
Класифікаційна ефективність (з відсіком 18 років) традиційних та DM -моделей була продемонстрована з точки зору чутливості, специфічності, позитивного прогнозного значення (PPV), негативного прогнозного значення (NPV) та області під характеристикою експлуатації приймача (AUROC) 27 (Таблиця 2, Рисунок 2 та додаткова рисунок 1 в Інтернеті). З точки зору чутливості внутрішнього тестового акумулятора, традиційні методи були найкращими серед чоловіків і гірше серед жінок. Однак різниця в класифікації між традиційними методами та SD становить 9,7% для чоловіків (MLP) і лише 2,4% для жінок (XGBoost). Серед моделей DM логістична регресія (LR) виявляла кращу чутливість в обох статей. Щодо специфіки внутрішнього тестового набору, було помічено, що чотири моделі SD добре працювали у самців, тоді як традиційна модель працювала краще у жінок. Відмінності в ефективності класифікації для чоловіків та жінок становлять 13,3% (MLP) та 13,1% (MLP) відповідно, що вказує на те, що різниця в ефективності класифікації між моделями перевищує чутливість. Серед моделей DM -моделей підтримки векторної машини (SVM), дерево рішень (DT) та випадкових лісів (RF), які найкраще працювали серед чоловіків, тоді як модель LR найкраще працювала серед жінок. AUROC традиційної моделі та всіх моделей SD був більшим за 0,925 (K-Nearse Sucke (KNN) у чоловіків), демонструючи відмінні класифікаційні показники у дискримінації 18-річних зразків28. Для зовнішнього тестового набору спостерігалося зниження ефективності класифікації з точки зору чутливості, специфічності та AUROC порівняно з внутрішнім набором тестів. Більше того, різниця в чутливості та специфічності між ефективністю класифікації найкращих та найгірших моделей становила від 10% до 25% і була більшою, ніж різниця у внутрішньому тестовому наборі.
Чутливість та специфічність моделей класифікації даних видобутку даних порівняно з традиційними методами з відсіком 18 років. Найближчий сусід KNN K, SVM Підтримка векторної машини, LR Logistic Regression, DT Tree River, RF Random Forest, XGB XGBoost, MLP Blothdayer Perceptron, традиційний метод CM.
Першим кроком у цьому дослідженні було порівняння точності оцінок стоматологічного віку, отриманих із семи моделей DM, отриманих за допомогою традиційної регресії. MAE та RMSE оцінювали у внутрішніх тестових наборах для обох статей, і різниця між традиційним методом та моделлю DM становила від 44 до 77 днів для MAE та від 62 до 88 днів для RMSE. Хоча традиційний метод був дещо точним у цьому дослідженні, важко зробити висновок, чи має така невелика різниця клінічного чи практичного значення. Ці результати свідчать про те, що точність оцінки стоматологічного віку за допомогою моделі DM майже така ж, як у традиційного методу. Пряме порівняння з результатами попередніх досліджень важко, оскільки жодне дослідження не порівнювало точність моделей DM з традиційними статистичними методами, використовуючи ту саму методику запису зубів у тому ж віковому діапазоні, що і в цьому дослідженні. Galibourg et al24 порівнювали MAE та RMSE між двома традиційними методами (Demirjian Method25 та Methods Willems29) та 10 -ти моделями DM у французькій популяції віком від 2 до 24 років. Вони повідомили, що всі моделі DM були більш точними, ніж традиційні методи, з різницею 0,20 та 0,38 років у МАЕ та 0,25 та 0,47 років у RMSE порівняно з методами Віллема та Демірджіана відповідно. Невідповідність між моделлю SD та традиційними методами, показаними в дослідженні Галібурга, враховує численні звіти 30,31,32,33, що метод Демірджіана не точно оцінює вік зубів у інших популяціях, ніж французькі канадці, на яких базувалося дослідження. У цьому дослідженні. Tai та ін. 34 використовували алгоритм MLP для прогнозування віку зуба з 1636 китайських ортодонтичних фотографій та порівняли його точність з результатами методу Демірцзяна та Віллемса. Вони повідомили, що MLP має більш високу точність, ніж традиційні методи. Різниця між методом Демірджіана та традиційним методом становить <0,32 роки, а метод Віллемс - 0,28 років, що аналогічно результатам цього дослідження. Результати цих попередніх досліджень24,34 також узгоджуються з результатами цього дослідження, а точність оцінки віку моделі DM та традиційний метод схожі. Однак, виходячи з представлених результатів, ми можемо лише обережно зробити висновок, що використання моделей DM для оцінки віку може замінити існуючі методи через відсутність порівняльних та довідкових попередніх досліджень. Для підтвердження результатів, отриманих у цьому дослідженні, необхідні подальші дослідження з використанням великих зразків.
Серед досліджень, що тестують точність SD в оцінці стоматологічного віку, деякі показали більш високу точність, ніж наше дослідження. Stepanovsky et al 35 застосовували 22 моделі SD до панорамних рентгенограм 976 членів Чехії у віці від 2,7 до 20,5 років та перевірили точність кожної моделі. Вони оцінили розвиток загальної кількості 16 верхніх та нижніх лівих зубів, використовуючи критерії класифікації, запропоновані Moorrees et al 36. MAE коливається від 0,64 до 0,94 року, а RMSE становить від 0,85 до 1,27 року, які є більш точними, ніж дві моделі DM, що використовуються в цьому дослідженні. Shen et al23 використовували метод камерій для оцінки стоматологічного віку семи постійних зубів у лівій нижній нижній смузі у східних китайських жителів віком від 5 до 13 років та порівняли з віками, оціненими за допомогою лінійної регресії, SVM та RF. Вони показали, що всі три моделі DM мають більш високу точність порівняно з традиційною формулою камери. MAE та RMSE в дослідженні Шен були нижчими, ніж у моделі ДМ у цьому дослідженні. Підвищена точність досліджень Степановського та ін. 35 та Shen et al. 23 може бути пов’язано з включенням молодших суб'єктів до їх дослідницьких зразків. Оскільки вікові оцінки для учасників з розробкою зубів стають більш точними, оскільки кількість зубів збільшується під час розвитку зубів, точність методу оцінки віку може бути порушена, коли учасники дослідження молодші. Крім того, помилка MLP в оцінці віку трохи менша, ніж SLP, це означає, що MLP є більш точним, ніж SLP. MLP вважається дещо кращим для оцінки віку, можливо, через приховані шари в MLP38. Однак для зовнішньої вибірки жінок є виняток (SLP 1,45, MLP 1,49). Виявлення того, що MLP є більш точним, ніж SLP при оцінці віку, вимагає додаткових ретроспективних досліджень.
Також порівнювали класифікаційні показники моделі DM та традиційний метод при 18-річному порозі. Усі тестовані моделі SD та традиційні методи внутрішнього тестового набору показали практично прийнятні рівні дискримінації для 18-річного зразка. Чутливість до чоловіків і жінок перевищувала 87,7% та 94,9% відповідно, а специфічність була більшою, ніж 89,3% та 84,7%. AUROC всіх тестованих моделей також перевищує 0,925. Наскільки нам відомо, жодне дослідження не перевірило ефективність моделі DM для 18-річної класифікації на основі строку зубів. Ми можемо порівняти результати цього дослідження з класифікаційними моделями глибокого навчання на панорамних рентгенограмах. Guo та ін. Чутливість та специфічність ручного методу становили відповідно 87,7% та 95,5%, а чутливість та специфічність моделі CNN перевищили 89,2% та 86,6% відповідно. Вони дійшли висновку, що моделі глибокого навчання можуть замінити або перевершити оцінку вручну в класифікації вікових порогів. Результати цього дослідження показали подібні класифікаційні показники; Вважається, що класифікація за допомогою моделей DM може замінити традиційні статистичні методи оцінки віку. Серед моделей DM LR була найкращою моделлю з точки зору чутливості до зразка чоловічої статі та чутливості та специфічності для жіночого зразка. LR займає друге місце за специфікою для чоловіків. Більше того, LR вважається однією з найбільш зручних моделей DM35 і є менш складним і важким для обробки. Виходячи з цих результатів, LR вважалася найкращою моделлю класифікації відсічення для 18-річних дітей у корейському населенні.
Загалом, точність вікової оцінки або ефективності класифікації на зовнішньому тестовому наборі була поганою або нижчою порівняно з результатами внутрішнього набору тестів. Деякі звіти свідчать про те, що точність класифікації або ефективність знижується, коли оцінки віку на основі корейського населення застосовуються до японського населення5,39, і в цьому дослідженні була виявлена ​​подібна закономірність. Ця тенденція погіршення також спостерігалася в моделі DM. Тому, щоб точно оцінити вік, навіть при використанні ДМ в процесі аналізу методи, отримані з даних про рідну популяцію, такі як традиційні методи, повинні бути кращими 5,39,40,41,42. Оскільки незрозуміло, чи можуть моделі глибокого навчання демонструвати подібні тенденції, дослідження, що порівнюють точність та ефективність класифікації, використовуючи традиційні методи, моделі DM та моделі глибокого навчання на одних і тих же зразках, щоб підтвердити, чи може штучний інтелект подолати ці расові розбіжності в обмеженому віці. оцінки.
Ми демонструємо, що традиційні методи можуть бути замінені на вікову оцінку на основі моделі DM в практиці оцінки віку судового віку в Кореї. Ми також виявили можливість впровадження машинного навчання для оцінки криміналістичного віку. Однак існують чіткі обмеження, такі як недостатня кількість учасників цього дослідження для остаточного визначення результатів та відсутність попередніх досліджень для порівняння та підтвердження результатів цього дослідження. Надалі дослідження ДМ повинні проводитися з більшою кількістю зразків та більш різноманітною популяцією для покращення його практичної застосовності порівняно з традиційними методами. Для підтвердження доцільності використання штучного інтелекту для оцінки віку у багатьох популяціях потрібні майбутні дослідження для порівняння точності класифікації та ефективності моделей DM та глибокого навчання з традиційними методами в одних і тих же зразках.
У дослідженні було використано 2657 ортографічних фотографій, зібраних у корейських та японських дорослих у віці від 15 до 23 років. Корейські рентгенограми були розділені на 900 навчальних наборів (19,42 ± 2,65 років) та 900 внутрішніх тестових наборів (19,52 ± 2,59 років). Навчальний набір був зібраний в одній установі (лікарня Сеула Сент -Мері), а власний тестовий набір був зібраний у двох установах (стоматологічна лікарня Національного університету Сеула та стоматологічна лікарня університету Йонсей). Ми також зібрали 857 рентгенограм з інших даних на основі населення (Iwate Medical University, Японія) для зовнішнього тестування. Рентгенограми японських суб'єктів (19,31 ± 2,60 років) були обрані як зовнішній набір тестів. Дані були зібрані ретроспективно для аналізу етапів розвитку зубів на панорамних рентгенограмах, взяті під час стоматологічної обробки. Усі зібрані дані були анонімними, за винятком статі, дати народження та дати рентгенографії. Критерії включення та виключення були такими ж, як і раніше опубліковані дослідження 4, 5. Фактичний вік вибірки обчислювали шляхом віднімання дати народження з дати взятої рентгенографії. Група вибірки була розділена на дев'ять вікових груп. У таблиці 3 показано розподіл віку та статі, це дослідження було проведено відповідно до Декларації Гельсінкі та затверджено Інституційною оглядовою комісією (IRB) лікарні Св. Марії Католицького університету Кореї (KC22WISI0328). Через ретроспективну конструкцію цього дослідження не вдалося отримати інформовану згоду від усіх пацієнтів, які проходять рентгенографічне обстеження для терапевтичних цілей. Університет Сеула Кореї (лікарня Св. Марії (IRB) відмовився від вимоги про усвідомлену згоду.
Стадії розвитку бімаксиларі Другого та третього моляра оцінювали за критеріями депуркану25. Було обрано лише один зуб, якщо той самий тип зуба був знайдений зліва та права сторони кожної щелепи. Якщо гомологічні зуби з обох сторін були на різних стадіях розвитку, зуба з нижчою стадією розвитку був обраний для врахування невизначеності в орієнтовному віці. Сто випадково відібраних рентгенограм з тренувального набору були оцінені двома досвідченими спостерігачами для тестування надійності Interobserver після попередньої калібрування для визначення стадії зрілості зубів. Первинним спостерігачем надійність внутрішньообсервера оцінювали двічі з інтервалом тримісяця.
Стадія статі та розвитку другого та третього моляра кожної щелепи в навчальному наборі оцінювалася первинним спостерігачем, навченим з різними моделями DM, і фактичний вік був встановлений як цільове значення. Моделі SLP та MLP, які широко використовуються в машинному навчанні, були протестовані проти алгоритмів регресії. Модель DM поєднує лінійні функції, використовуючи етапи розвитку чотирьох зубів і поєднує ці дані для оцінки віку. SLP - це найпростіша нейронна мережа і не містить прихованих шарів. SLP працює на основі порогової передачі між вузлами. Модель SLP в регресії математично схожа на множинну лінійну регресію. На відміну від моделі SLP, модель MLP має кілька прихованих шарів з нелінійними функціями активації. Наші експерименти використовували прихований шар з лише 20 прихованими вузлами з нелінійними функціями активації. Використовуйте градієнтний спуск як метод оптимізації та MAE та RMSE як функцію втрат для підготовки нашої моделі машинного навчання. Найкраща отримана регресійна модель була застосована до внутрішніх та зовнішніх тестових наборів та оцінювали вік зубів.
Був розроблений алгоритм класифікації, який використовує зрілість чотирьох зубів на навчальному наборі, щоб передбачити, чи зразок 18 років чи ні. Для побудови моделі ми отримали сім алгоритмів для вивчення машинного навчання 6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost та (7) MLP . LR - один з найбільш широко використовуваних алгоритмів класифікації44. Це наглядовий алгоритм навчання, який використовує регресію для прогнозування ймовірності даних, що належать до певної категорії від 0 до 1, і класифікує дані як належність до більш імовірної категорії на основі цієї ймовірності; в основному використовується для бінарної класифікації. KNN - один з найпростіших алгоритмів машинного навчання45. Коли надаються нові вхідні дані, він знаходить k дані близькими до існуючого набору, а потім класифікує їх у клас з найвищою частотою. Ми встановили 3 для кількості сусідів, що розглядаються (k). SVM-це алгоритм, який максимізує відстань між двома класами за допомогою функції ядра для розширення лінійного простору в нелінійний простір, який називається полями46. Для цієї моделі ми використовуємо зміщення = 1, потужність = 1 і гамма = 1 як гіперпараметри для поліноміального ядра. DT застосовується в різних полях як алгоритм поділу цілих даних, встановлених на кілька підгруп, представляючи правила прийняття рішень у структурі дерева47. Модель налаштована з мінімальною кількістю записів на вузол 2 і використовує індекс GINI як міру якості. RF - це метод ансамблю, який поєднує декілька DTS для підвищення продуктивності за допомогою методу агрегації завантажувальної програми, який генерує слабкий класифікатор для кожного зразка шляхом випадкового малювання зразків одного розміру кілька разів від вихідного набору даних48. Ми використовували 100 дерев, глибини 10 дерев, 1 мінімальний розмір вузла та індекс домішки Gini як критерії поділу вузлів. Класифікація нових даних визначається більшістю голосів. XGBoost - це алгоритм, який поєднує методи прискорення за допомогою методу, який приймає в якості навчальних даних Помилка між фактичними та передбачуваними значеннями попередньої моделі та збільшує помилку за допомогою градієнта49. Це широко використовуваний алгоритм завдяки його хорошій ефективності та ефективності ресурсів, а також високою надійністю як функцією виправлення. Модель оснащена 400 колесами підтримки. MLP - це нейронна мережа, в якій один або кілька перцепторів утворюють кілька шарів з одним або декількома прихованими шарами між вхідними та вихідними шарами38. Використовуючи це, ви можете провести нелінійну класифікацію, коли, коли ви додаєте вхідний шар і отримаєте значення результату, передбачуване значення результату порівнюється зі значенням фактичного результату, і помилка поширюється назад. Ми створили прихований шар з 20 прихованими нейронами в кожному шарі. Кожна розроблена нами модель була застосована до внутрішніх та зовнішніх наборів для тестування ефективності класифікації шляхом обчислення чутливості, специфічності, PPV, NPV та AUROC. Чутливість визначається як співвідношення вибірки, оціненого у віці 18 років або старше до вибірки, що оцінюється у віці 18 років або старше. Специфіка - це частка зразків до 18 років, а ті, хто оцінюється у віці до 18 років.
Стоматологічні етапи, оцінені в навчальному наборі, були перетворені на числових етапів для статистичного аналізу. Багатоваріантна лінійна та логістична регресія була проведена для розробки прогнозних моделей для кожної статі та отримання регресійних формул, які можна використовувати для оцінки віку. Ми використовували ці формули для оцінки віку зуба як для внутрішніх, так і для зовнішніх тестових наборів. У таблиці 4 наведені моделі регресії та класифікації, що використовуються в цьому дослідженні.
Внутрішньо- та надійність Interobserver розраховували за допомогою статистики Каппа Коена. Для перевірки точності моделей DM та традиційних регресій ми обчислили MAE та RMSE, використовуючи розрахунковий та фактичний вік внутрішніх та зовнішніх тестових наборів. Ці помилки зазвичай використовуються для оцінки точності модельних прогнозів. Чим менша помилка, тим вище точність прогнозу24. Порівняйте MAE та RMSE внутрішніх та зовнішніх тестових наборів, обчислених за допомогою DM та традиційної регресії. Класифікаційні показники 18-річного відсічення в традиційній статистиці оцінювали за допомогою таблиці надзвичайних ситуацій 2 × 2. Розрахована чутливість, специфічність, PPV, NPV та AUROC тестового набору порівнювали з вимірюваними значеннями моделі класифікації DM. Дані виражаються як середнє ± стандартне відхилення або число (%) залежно від характеристик даних. Двосторонні значення P <0,05 вважалися статистично значущими. Всі рутинні статистичні аналізи проводили за допомогою SAS версії 9.4 (Інститут SAS, Cary, NC). Модель регресії DM була реалізована в Python за допомогою KERAS50 2.2.4 Backend та TensorFlow51 1.8.0, спеціально для математичних операцій. Модель класифікації DM була реалізована в середовищі аналізу знань Waikato та Miner Information Miner (KNIME) 4.6.152 Аналіз.
Автори визнають, що дані, що підтверджують висновки дослідження, можна знайти у статті та додаткових матеріалах. Набори даних, що генеруються та/або проаналізовані під час дослідження, доступні у відповідного автора за розумним запитом.
Ritz-Timme, S. et al. Оцінка віку: сучасність для задоволення конкретних вимог криміналістичної практики. міжнародність. J. Юридична медицина. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G., and Olze, A. Поточний статус криміналістичної вікової оцінки живих предметів для цілей кримінального переслідування. Криміналістика. ліки. Патологія. 1, 239–246 (2005).
Пан, Дж. Та ін. Модифікований метод оцінки стоматологічного віку дітей віком від 5 до 16 років у Східному Китаї. клінічний. Усне обстеження. 25, 3463–3474 (2021).
Лі, СС тощо. міжнародність. J. Юридична медицина. 124, 659–665 (2010).
О, С., Кумагай, А., Кім, Си та Лі, СС точності вікової оцінки та оцінки 18-річного порогу на основі зрілості другого та третього молярів у корейців та японців. PLOS ONE 17, E0271247 (2022).
Кім, Джі та ін. Передопераційний аналіз даних на основі машинного навчання може передбачити результат лікування хірургії сну у пацієнтів з ОСА. наука. Звіт 11, 14911 (2021).
Хан, М. та ін. Точна оцінка віку від машинного навчання з втручанням людини або без них? міжнародність. J. Юридична медицина. 136, 821–831 (2022).
Хан, С. та Шахін, М. Від видобутку даних до видобутку даних. Дж. Інформація. наука. https://doi.org/10.1177/01655515211030872 (2021).
Хан, С. та Шахін, М. Вісруле: Перший когнітивний алгоритм для видобутку правил асоціації. Дж. Інформація. наука. https://doi.org/10.1177/01655515221108695 (2022).
Шахін М. та Абдулла У. Карм: Традиційний видобуток даних на основі правил асоціації на основі контексту. обчислити. Метт. Продовжити. 68, 3305–3322 (2021).
Мухаммед М., Рехман З., Шахін М., Хан М. та Хабіб М. Дизекйоване семантичне виявлення семантичної подібності за допомогою текстових даних. інформувати. Технології. КОНТРОЛЬ. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z., and Shahin, M. Система розпізнавання активності у спортивних відео. мультимедіа. Інструменти програми https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS та ін. Виклик машинного навчання RSNA в дитячому кістковому віці. Радіологія 290, 498–503 (2019).
Лі, Ю. та ін. Оцінка криміналістичного віку від тазових рентгенівських променів з використанням глибокого навчання. Євро. випромінювання. 29, 2322–2329 (2019).
Guo, YC та ін. Точна вікова класифікація за допомогою ручних методів та глибоких згорткових нейронних мереж із ортографічних проекційних зображень. міжнародність. J. Юридична медицина. 135, 1589–1597 (2021).
Алабама Далора та ін. Оцінка віку кісток за допомогою різних методів машинного навчання: систематичний огляд літератури та метааналіз. PLOS ONE 14, E0220242 (2019).
Du, H., Li, G., Cheng, K., and Yang, J. міжнародність. J. Юридична медицина. 136, 811–819 (2022).
Кім С., Лі Ю, Нох Юк, Парк FK та OH KS, що визначають вікові групи живих людей, використовуючи зображення перших молярів на основі штучного інтелекту. наука. Звіт 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N., and Urschler, M. Автоматична вікова оцінка та більшість вікових класифікацій з багатоваріантних даних МРТ. IEEE J. BIOMED. Сповіщення про здоров'я. 23, 1392–1403 (2019).
Cheng, Q., GE, Z., Du, H. and Li, G. Оцінка віку на основі сегментації 3D -пульпової камери перших молярів з комп'ютерної томографії конуса, інтегруючи набори глибокого навчання та рівня. міжнародність. J. Юридична медицина. 135, 365–373 (2021).
Wu, WT та ін. Обробка даних у клінічних великих даних: загальні бази даних, етапи та моделі методів. Світ. ліки. ресурс. 8, 44 (2021).
Ян, Дж. Та ін. Вступ до медичних баз даних та технологій видобутку даних в епоху великих даних. J. Avid. Основна медицина. 13, 57–69 (2020).
Шен, С. та ін. Метод камери для оцінки віку зубів за допомогою машинного навчання. BMC Health Health 21, 641 (2021).
Galliburg A. et al. Порівняння різних методів машинного навчання для прогнозування стоматологічного віку за допомогою методу постановки Демірджіана. міжнародність. J. Юридична медицина. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. and Tanner, JM - нова система оцінки стоматологічного віку. фрагмент. біологія. 45, 211–227 (1973).
Landis, JR та Koch, GG заходи угоди спостерігача щодо категоричних даних. Біометрика 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK та Choi HK. Текстурний, морфологічний та статистичний аналіз двовимірної магнітної резонансної томографії за допомогою методів штучного інтелекту для диференціації первинних пухлин мозку. Інформація про здоров'я. ресурс. https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Час посади: 04-2024 січня