אפשר לנצל את הבדיקות יותר ביעילות באמצעות שילוב למידת מכונה

סיווג מוקדם של הנבדקים באמצעות שיטות למידת מכונה יגדיל בצורה משמעותית את יעילות הבדיקות ובכך יאפשר הקדמת צעדי היציאה מן ההסגר

/ פרופ' יורם לוזון, פרופ' לב מוצ'ניק ועומר קורן, צוות AI מפא"ת /

תקציר מנהלים

בימים האחרונים התפרסמו לפחות חמש "תוכניות יציאה" שונות. המשותף לכל התוכניות הינו שכולן מבוססות על הצורך במספר רב ובקצב מהיר של בדיקות כדי לאמוד את מספר החולים בכל זמן נתון ולאתר את מירב הנשאים על מנת למנוע התפרצויות נוספות של הנגיף. לא נראה שקצב הבדיקות הנוכחי והצפוי בשבועות הקרובים ישיגו את קצב ההדבקה ויאפשרו שליטה הדוקה על המחלה תוך כדי ולאחר היציאה מההסגר. מצב זה מעכב יציאה מהירה מן המדיניות הנוכחית ומן ההסגר. 

אולם, ניתוח נתוני הבדיקות שפורסמו על ידי משרד הבריאות בימים האחרונים, מראה כי אפשר לעקוף את מגבלת קצב הבדיקות ולהגדיל את יעילותן. כפי שנראה בהמשך, באמצעות מודל חישובי המבוסס על שיטות למידת מכונה ניתן לחזות את תוצאותיהן של מרבית הבדיקות המתבצעות היום, בדיוק גבוה. לפיכך ניתן, לדעתנו, לרכז את מאמץ המעבדות בקבוצה קטנה של דגימות עליהן יש אי-וודאות. 

אנחנו מעריכים שסיווג מוקדם של הנבדקים באמצעות שיטות למידת מכונה דוגמת השיטה המוצעת להלן, יאפשר להגדיל את גודל האוכלוסיה האפקטיבית הנבדקת בצורה משמעותית. אם הנתונים שפורסמו על ידי משרד הבריאות אמינים ואינם סובלים מהטיה חמורה, ניתן להגדיל את האוכלוסיה האפקטיבית הנבדקת לפחות פי 5, עם אותה כמות הבדיקות, ובכך להקדים את היציאה מההסגר תוך בקרה הדוקה יותר על בריאות הציבור. 

שני גורמים נוספים התומכים בהתחלת צעדי יציאה מההסגר כבר היום הינם התפתחות מספר החולים קשה והמתים והרווח המוגבל מאוד אותו עדיין ניתן להפיק מן הצעדים הנוכחיים. מה- 26 במרץ, מספר ומשך המגעים עם בני הבית גבוהים משמעותית ממספר ומשך המגעים עם זרים. כל הצעדים שננקטו מאז ה- 26 במרץ והלאה מגדילים את משך המגעים בין בני הבית ובכך מגדילים את כמות ההדבקות. מצד שני, מספר ומשך המגעים בחוץ כבר נמוכים מאוד והתרומה של מגעים אלו להדבקה הינה שולית, כך שהימשכות הצעדים המגבילים מגעים באוכלוסיה הכללית אחרי ה- 26 במרץ מיותרת ואולי בצורה מסוימת מזיקה. בנוסף, אחוז החולים המאומתים שמקור ההדבקה שלהם ידוע הולך ויורד ואחוז החולים המאומתים שמקור ההדבקה שלהם אינו ידוע גדל והופך לרוב ההדבקות, כך לפי נתוני משרד הבריאות, ולכן בידוד של מי שבא במגע עם חולה מאומת לא יעצור את המגפה אבל כן גובה נזק משמעותי ממערכת הבריאות. יש להפוך את מדיניות הבידוד גם היא ליותר פרטנית. הרבה אנשים חיוניים יכולים להמשיך לעבוד (בטח במערכת הבריאות), גם אם היו במגע מזדמן עם חולה מאומת.

סיכום ממצאים קודמים

בפוסט הראשון והשני בסדרה זו נימקנו מספר טענות שרובן התקבלו על ידי הציבור: 

  1. יש צורך בהגדרה מסודרת של מטרות המאבק בקורונה.
  2. העקומה כבר התיישרה ומספר החולים הפסיק לעלות בצורה מעריכית בערך ב- 13 במרץ, עוד לפני צעדי ההסגר הדרסטיים שננקטו סביב ה- 26 במרץ. 
  3. סגר כולל מיותר ואולי אף מזיק. 
  4. כמות החולים המאומתים המדווחת היא מדד לא מייצג שתלוי בעיקר בכמות הבדיקות. מדד הרבה יותר מייצג הוא כמות החולים קשה שעל פי הנתונים האחרונים יציב.
  5. מצב התמותה בישראל שונה מהותית מהמצב בארצות אירופה ולא צפוי לדמות להן.
  6. למרות שחלה התייצבות יחסית בקצב עליית החולים קשה, לפי הניסיון במקומות אחרים לא צפויה העלמות של הנגיף או ירידה מהירה בכמות החולים החדשים, כנראה עקב העדר חסינות עדר.
  7. הגדלה של כמות הבדיקות לא תספיק ויש צורך בשינוי מדיניות הבדיקות.

במהלך החודשים האחרונים הרבה מן ההחלטות שהתקבלו הסתמכו על מודלים אפידמיולוגיים. מודלים אלו מבוססים על הנחות ועל תצפיות. למרבה השמחה, רוב התחזיות של המודלים הללו לא התממשו (עשרות אלפי מונשמים, עשרת אלפים מתים תוך כמה שבועות מתחילת המגפה, קריסה של מערכת הבריאות ועוד). אנו מציעים בהמשך ניתוח שמבוסס ברובו על נתונים, כמעט ללא הנחות של מודלים. 

כמות החולים המדווחים לא מהווה מדד אמין להתפתחות המחלה

הרבה החלטות הקשורות לניהול המגפה וגם ביצוע מוצלח של חלק מתוכניות היציאה שפורסמו מסתמכים על מדידת כמות החולים המאומתים. אולם ההגדרה של חולה מאומת היא מאוד בעייתית. ההגדרה תלויה בכמות הבדיקות, בניהול תור הבדיקות ובעיקר במדיניות הבדיקות. במדיניות שהייתה בתוקף עד לימים האחרונים, או לכל הפחות עד לסוף חודש מרץ – לפיה רק מי שהיה במגע עם חולה מאומת (או שב מחו"ל) ומראה תסמינים נבדק – יתכן כי הרבה חולים לא נצפו. כמו כן, בגלל מגבלה על כמות הבדיקות ובשל העובדה שאחוז הבדיקות החיוביות קבוע (ראה תרשים מס' 1 להלן), כמות החולים המאומתים החדשים פרופורציונית לכמות הבדיקות.

תרשים מס' 1: אחוז הבדיקות שתוצאתן חיובית על פני ציר הזמן (למעלה) ודיאגרמת פיזור של כמות הבדיקות החיוביות מול כמות הבדיקות סה"כ בכל יום (למטה). התרשימים מראים כי כמות החולים המאומתים החדשים פרופורציונית לכמות הבדיקות. התרשימים מבוססים על נתוני משרד הבריאות, התרשים העליון לקוח מאתר covid19data.co.il

שינויים בכמות החולים יכולים לנבוע בקלות משינויים בכמות הבדיקות או במדיניות הבדיקות. בהערכות קודמות הערכנו את כמות החולים להיות בערך פי ארבע מכמות החולים המדווחים. ניתן לאמוד את כמות החולים הלא ידועים על סמך אחוז החולים שבאים ממקור לא ידוע (ראה פרטים מלאים בפוסט הראשון בסדרה שמנתח את הנושא). נתון מעניין הוא שאחוז החולים ממקור לא ידוע הולך ועולה (ראה תרשים מס' 2 להלן מתוך נתוני משרד הבריאות) ובימים האחרונים מהווה החלק הארי של החולים המאומתים החדשים. מכאן ניתן להסיק שאחוז החולים שמקור הדבקתם ידוע הולך וקטן וחלק הולך וגדל מההדבקה עוברת דרך אוכלוסיה שלא נבדקה. כלומר, כמות הבדיקות לא מספיקה להדביק את קצב ההדבקה (כמו שנידון בפוסט השני בסדרה). הערת אגב חשובה שנובעת מכך היא שבידוד של מי שבא במגע עם חולה מאומת מאבד מן היעילות שלו, שכן הוא מכסה כמות קטנה מן החולים (כלומר – רק חולים שנבדקו ורק אחרי שכבר דווחו תוצאות הבדיקות שלהם). לפי דו"ח של מכון גרטנר שפורסם בתקשורת, פעולות הבידוד מצליחות לעצור לכל היותר 20% משרשראות ההדבקה וכנראה פחות. כל עוד הנזק של הבידוד הוא לא דרסטי אין בכך פגם, אך ברגע שכמות המבודדים הגבוהה משפיעה לרעה על פעילות מערכת הבריאות ומטילה עומס משמעותי על המערכת מסביבם – בדיוק כמו הניטור, גם הבידוד חייב להיות דיפרנציאלי לפי סיכויי הנזק והתועלת (לדוגמא – סיכוי ההדבקה לאחרים, חיוניות של המבודד למערכת הבריאות, הנזק מן הבידוד למבודד). 

תרשים מס' 2: אחוז הבדיקות החיוביות לקורונה בכל יום לפי מקור ההדבקה. ניתן לראות כי בימים האחרונים מעל 50% מהבדיקות החיוביות מסווגות כ"Other". התרשים מבוסס על הנתונים שפורסמו על ידי משרד הבריאות

מספר תוכניות היציאה שפורסמו מסתמכות על מעקב הדוק אחר דרכי ההתפשטות (לדוגמא, תוכנית המל"ל ותוכנית מכון גרטנר). ההנחה היא שניתן לזהות מקור של כל הדבקה, לאתר ולבדוק כל מגע של החולה ובכך לחסום שרשראות של הדבקות בתחילתן. למרות העליה במספר הבדיקות ושיכלול מאמצי האיתור, המגמה היא – ירידה מתמדת באחוז הזיהוי של מקורות ההדבקה. על כן, ביסוס תוכניות היציאה על הבדיקות ועל התחקירים האפידמיולוגיים נראית בעייתית. עם הזמן הקושי לאתר את מי שצריך לבדוק יעלה וכמות הבדיקות הנדרשת תזנק.

מספר הבדיקות לא מכסה את קצב ההדבקה – ניתן לשקול בדיקות יותר חכמות ולא (רק) להגדיל את כמות הבדיקות

ישנן גישות שונות לקביעת המספר הנדרש של בדיקות ביום – כשהטווח נע בין 17,000 בדיקות ביום (מסמך אסטרטגיית היציאה של מכון גרטנר) לבין 40,000 בדיקות ביום (הפוסט הראשון בסדרה זו).  כך או כך, מספר זה הוא גבוה בהרבה מן המתבצע כיום – ולכן  ניתן להעריך בצורה ברורה שרוב החולים החדשים לא מזוהים. 

בתרשים מס' 1 לעיל ראינו כי מסתמנת רוויה של הבדיקות, ובנוסף נראה כי המרחק בין היכולת הנוכחית לביצוע בדיקות לבין המספר הנדרש הינו רב. לפיכך להגדלת יעילות הבדיקות יש חשיבות גבוהה. הגישה של בדיקות על סמך הקריטריונים הנוכחיים, לדעתנו, היא בזבזנית ולא יעילה. ניתן לאמוד את תוצאות רוב הבדיקות מראש על סמך קריטריונים קליניים בסיסיים כפי שמשתקף מנתוני הבדיקות והנבדקים שפורסמו לאחרונה על ידי צוות תמנ"ע במשרד הבריאות

על מנת לבחון השערה זו השתמשנו במדדים הקליניים שתועדו ברשומות הבדיקות שפורסמו: תסמינים שהופיעו טרם מועד ביצוע הבדיקה (שיעול, חום, קוצר נשימה, כאב ראש, כאב גרון), נתונים דמוגרפיים (מגדר, האם הנבדק מעל או מתחת גיל 60) והאינדיקציה שהובילה לביצוע הבדיקה (מגע עם חולה מאומת, שיבה מחו"ל, אחר). 

על הנתונים האלו הפעלנו מודלים חישוביים מבוססי אלגוריתמי למידת מכונה סטנדרטיים (התוצאות שיוצגו להלן מבוססות על אנסמבל של עצי החלטה – Random Forest – אולם הפעלת טכניקות אחרות, ובפרט XGBoost ורשתות נוירונים, הובילה לתוצאות דומות). מודל הלמידה החישובית שאומן קיבל כקלט את הנתונים הקליניים שתוארו לעיל והוציא כפלט תחזית הסתברותית לכל בדיקה – תוצאה מוערכת חיובית או שלילית. המודל "התאמן" על 70% מהרשומות ("סט אימון" שכלל 87,126 בדיקות) ותוצאות המודל הוערכו על ידי ביצוע תחזיות על 30% מהרשומות ("סט מבחן" שכלל 37,340 בדיקות).  תחזיות המודל על "סט המבחן" הושוו לתוצאות האמת – תוצאות שלא היו ידועות למודל בשלב האימון. סט הנתונים שפורסם על ידי משרד הבריאות כולל גם 1,601 רשומות שתוצאות הבדיקה שלהן מוגדרת כ"אחר" (לפי התיעוד אלו בדיקות שטרם בוצעו, בעבודה או שתוצאותיהן לא וודאיות). רשומות אלו הוסרו מסט הנתונים לפני אימון המודל.   

תרשים מס' 3: עקומה אופיינית (ROC) למסווג Random Forest שאומן. העקומה מציגה אחוז True Positives (ציר y) מול אחוז False Positives (ציר x) בהינתן ספי קבלה שונים – אל מול סט האימון (כחול) וסט המבחן (אדום). ניתן לראות כי השטח מתחת לעקומה (AUC) על סט המבחן עומד על 0.922 – ומבטא דיוק גבוה יחסית של מסווג על נתונים בסיסיים כל כך.

התוצאות מראות שניתן להיפטר מכ- 80% מהבדיקות ולהחליפן בבדיקות וירטואליות. נסביר: לכל בדיקה המודל חוזה את תוצאת הבדיקה (חיובית או שלילית). בנוסף לתוצאת הבדיקה המודל גם מעריך את ההסתברות שתחזית זו הינה נכונה. מהצגת שכיחות ההסתברויות (היסטוגרמת ההסתברויות) של תחזיות המודל על גבי סט האימון מתקבלת התמונה הבאה:

תרשים מס' 4: תחזיות המודל (סט אימון) – היסטוגרמת ההסתברויות לתוצאה חיובית לקורונה. ניתן לראות בבירור את שתי הקבוצות המובהקות של הבדיקות – חיוביות במובהק ושליליות במובהק.

זאת אומרת, אם הנתונים שפורסמו על ידי משרד הבריאות הם אמינים, ניתן לחסוך את ביצוען כ- 80% מהבדיקות על ידי החלפתן ב"בדיקות וירטואליות" – בדיקות שעל פי המאפיינים הקליניים שתוארו לעיל ניתן לחזות ברמת ביטחון גבוהה את תוצאותיהן. באמצעות קביעת שני ספים (Thresholds) לסינון תחזיות המודל – מתקבלות שתי תתי קבוצות של דגימות – החיוביות במובהק והשליליות במובהק, שביחד מהוות כ- 80% מהדגימות (78.6% מסט האימון ו- 78.5% מסט המבחן), עבורן רמת הביטחון בתחזיותיו של המודל הינה גבוהה. נדגיש כי גם ספים אלו ניתנים לכיול במגוון שיטות מתקדמות. בניסוי שלנו הם כויילו בצורה פשוטה. גם כיול הספים בוצע תוך שימוש בסט האימון בלבד (ללא כל שימוש בתוצאות האמיתיות של הבדיקות מסט המבחן). כך, למשל, הרוב המכריע של הנבדקים שהיו במגע עם חולה מאומת והראו שילוב של תסמינים – אכן יצאו חיוביים בבדיקה. הנבדקים בקבוצה זו משוייכים לקבוצת "הבדיקות החיוביות במובהק" והמודל סיווג אותם, בהתאם, כחיוביים. 

לאחר סינון התחזיות הלא-וודאיות של המודל והשארת הבדיקות המשתייכות לקבוצות המובהקות בלבד – מתקבלות, על סט המבחן, התוצאות הבאות:

תרשים מס' 5: Confusion Matrix של התוצאות על סט המבחן לאחר סינון תוצאות המודל לפי שני ערכי סף.

ניתן לראות שעבור 78.5% מהבדיקות, לאחר סינון הבדיקות שתחזית המודל לגביהן אינה מובהקת, המודל החישובי חזה את תוצאות הבדיקה ברמת דיוק טובה, בביצועים הבאים:

  1. 1,697 תוצאות חיוביות נכונות (TP, תוצאות בדיקה חיוביות לקורונה שהמודל העריך כחיוביות).
  2. 27,031 תוצאות שליליות נכונות (TN, תוצאות בדיקה שליליות לקורונה שהמודל העריך כשליליות).
  3. 249 תוצאות חיוביות שגויות (FP, תוצאות בדיקה שליליות לקורונה שהמודל העריך כחיוביות).
  4. 326 תוצאות שליליות שגויות (FN, תוצאות בדיקה חיוביות לקורונה שהמודל העריך כשליליות). 

הרגישות (Sensitivity או Recall) המוגדרת כיחס TP/(TP+FN) עומדת על 0.839.  

הספציפיות (Specifity או TNR) המוגדרת כיחס TN/(TN+FP) עומדת על 0.941.

הדיוק (Precision) המוגדר כיחס TP/(TP+FP) עומד על 0.872.

למיטב ידיעתנו והבנתנו אלו תוצאות טובות מאוד. נדגיש כי תוצאות אלו הן על סמך נתונים גולמיים גסים מאוד שפורסמו לציבור על ידי משרד הבריאות – וסביר מאוד להניח שהן עוד ישתפרו ככל שאיכות וכמות הנתונים תשתפר. 

גישה זה משאירה רק כ- 20 אחוז מן הנבדקים (או פחות, בהמשך, עם שיפור יכולות המודל) אותם צריך לבדוק, שכן עבורם תוצאות הבדיקה אינן ניתנות לחיזוי. מדיניות כזו תאפשר בדיקה גורפת של מי שצריך מחד והחלטות גורפות לגבי אוכלוסיות רחבות מאידך. כמו כן, מדיניות שכזו תאפשר מקום לבדיקות סקר להערכת רמת התחלואה באזורים שונים ובמידת הצורך מדגם לבקרה ושיפור של מודל הלמידה החישובית.

בתרשים מס' 6 להלן ניתן לראות בבירור את הקיבוץ של תוצאות בדיקה חיוביות (אדום) ושליליות (ירוק). הגוש המרכזי של הבדיקות הוא של בריאים (שליליים לקורונה). התרשים מדגיש את העובדה שכך, ללא שום בדיקה, ניתן לזהות את רוב החולים והבריאים (החיוביים והשליליים לקורונה) מתוך מספר קטן של סימפטומים כל כך בסיסיים שאפשר אף לאסוף באמצעות מנגנון אמין של דיווח עצמי.

תרשים מס' 6: דיאגרמת פיזור של בדיקות חיוביות לקורונה (אדום) ושליליות לקורונה (ירוק). הערכים של כל ציר עבור כל בדיקה נקבעו באמצעות הפעלת טכניקת T-SNE להפחתת מימד – המאפיינים הקליניים (סימפטומים, קטגוריית גיל, מגדר, אינדיקציה לביצוע הבדיקה) "נדחסו" לשני מימדים בלבד תוך שימור (ככל האפשר) על קירבה בין בדיקות במרחב הרב-מימדי של המאפיינים הקליניים. בתרשים מוצגות 98,178 בדיקות (תצפיות זהות עולות זו על זו). יודגש כי לא בוצע שימוש בתוצאת הבדיקה (חיובי/שלילי לקורונה) ליצירת התרשים – למעט קביעת צבע הסמן של כל תצפית. התרשים ממחיש בצורה ברורה את הפרדיקטביליות של בעיית הסיווג – קל לראות כי בדיקות ירוקות (שליליות) ואדומות (חיוביות) מתקבצות בצורה טבעית בתרשים, המהווה ייצוג ויזואלי פשטני של המרחב הרב מימדי של המאפיינים הקליניים. 

קצב קבוע של אחוז הבדיקות החיוביות לאורך זמן (כ- 6% – 7%) מלמד שהגדלת כמות הבדיקות לא תאפשר שליטה הדוקה בהתפשטות המחלה. לעומת זאת, מודל חיזוי המבוסס על אותם הנתונים מצליח לסווג כ- 80% מהתוצאות על פי סימפטומים בסיסיים בלבד בדיוק גבוה. בהינתן העובדה שניתן לאסוף את הסימפטומים בצורה זולה ויעילה (ואף מרחוק!) – שימוש במודל חיזוי יאפשר להרחיב את מספר האנשים שיבדקו באופן סדיר בצורה דרמטית, להגדיל את קצב הבדיקה ולאפשר בקרה טובה על התפשטות המחלה תוך כדי תפעול המשק. בדיקות מעבדה יטפלו במקרים שלא יסווגו על ידי המודל בצורה אמינה. חלק מבדיקות המעבדה יוקדשו לאימות המודל ושיפורו. כפי שצויין, השתמשנו בנתונים מאוד גולמיים. הוספת נתונים מדויקים (כגון גיל מדויק, קבוצת אוכלוסיה, מקום מגורים וסימפטומים נוספים) צפויה להמשיך ולשפר את המודל. כמו כן, בהינתן נתונים מתאימים, ניתן יהיה לעשות חיזוי דומה להתפתחות תסמינים קשים ולהקדים בטיפול אינטנסיבי (פעילות חשובה במיוחד כאשר רוב החולים לא מתאשפזים ולא זוכים למעקב רפואי צמוד). 

נדגיש כי התוצאות רגישות, במידה מסויימת, להטיות שקיימות במערך האיסוף והתיעוד של נתוני הבדיקות על ידי משרד הבריאות. כך, למשל, אם התיחקור של הנבדקים שתוצאת הבדיקה שלהם חיובית הוא מפורט ומדוקדק והתסמינים של קבוצה זו מתועדים ברשומות בצורה מדויקת בדיעבד (לאחר קבלת התוצאה החיובית), בעוד שהתסמינים של שאר הנבדקים מתועדים ברמה שיטחית בלבד במעמד הבדיקה בלבד – עשויה להתקבל הטיה משמעותית של דאטה חסר לגבי התסמינים (הטיית "Missing Not at Random"). בהיעדר מידע מפורט על מערך הבדיקות ועל מערך התיעוד קשה לנו לאמוד את מידת ההשפעה של הטיה זו. אנו תקווה שהתוצאות המובאות כאן יעודדו את משרד הבריאות להמשיך ולפרסם נתונים יותר מפורטים אודות הבדיקות ואודות מערך התיעוד וכך לאפשר לנו ולחוקרים נוספים לאמוד בצורה מדויקת יותר את השפעת ההטיות ולשפר את המודלים.

מילה אחרונה על עוצר (טענה: ההדבקה המעריכית הסתיימה מזמן ויתכן כי עוצר מגביר את המגפה)

הנתונים על מספר החולים קשה ומספר המתים סובלים מהשהיית זמן ביחס לנתונים על מספר החולים המאומתים, אולם גם מספר החולים וגם מספר המתים התייצב (ראה תרשים מס' 7 להלן). כאשר לוקחים בחשבון הסטה של כשבועיים בין הדבקה למוות והסטה של כ- 9 ימים בין הדבקה להתדרדרות למצב קשה, ברור שההדבקה התייצבה לקראת ה- 13 למרץ (מה שהוגדר בתור מטרת הצעדים – יישור העקומה). כמו כן יש לציין שמטרת העל – מניעה של קריסת מערכת הבריאות, הושגה במלואה. לפי נתוני משרד הבריאות, נכון לבוקר ה- 12 באפריל, 731 חולים מאושפזים בבתי חולים ו- 123 מהחולים מחוברים למכשירי הנשמה (ירידה של 6.8% ביחס ל- 11 באפריל) כאשר ישנם כ-1,800 מכשירי הנשמה נוספים.

תרשים מס' 7: מס' החולים החדשים במצב קשה (שמאל למעלה), סך החולים במצב קשה (ימין למעלה) מס' המתים החדשים (שמאל למטה) וסך המתים (ימין למטה) – כל התרשימים בסקאלה לוגריתמית. 

מטרת הרבה מן הצעדים הנוכחיים (כולל הסגר, הבידוד, העוצר והריחוק החברתי) היא להמשיך ולהוריד את קצב ההדבקה ע"י מיזעור מספר המגעים. אולם, סיכויי ההדבקה תלויים לא רק בכמות המגעים אלא גם באינטנסיביות – משך המגע והסביבה בה הוא מתרחש (לדוגמא, אכילה משותפת המעלה סיכוי להעברת נוזלים הרבה יותר משמעותית ממפגש אקראי מרחוק ברחוב). מחקרים אכן מאשרים שרוב ההדבקות המשניות נרשמו בין בני בית, במגע לא מוגן בבתי חולים או סביבה סגורה אחרת כמו "ספינת הקורונה" (Diamond Princess). כך למשל, מחקר אחד מדווח כי 41% מ-138 החולים שנבדקו נדבקו בבית חולים עצמו.  מחקר נוסף החוקר התפרצות בבית אבות מאתר דיירת יחידה כמקור ההדבקה של 129 מטופלים ואנשי צוות. כ- 700 מתוך 3,700 נוסעים ואנשי צוות נדבקו במהלך ארבעת שבועות הסגר על "ספינת הקורונה". בזמן שסיכוי ההדבקה במפגש אקראי מוערך בכ- 0.5%, סיכוי ההדבקה בתוך המשפחה מגיע ל- 10.5%. מחקרים נוספים מוצאים ערכים שונים מעט, אך המגמה ברורה מאוד. 

 כל הצעדים שננקטו נועדו להקטין את כמות המגעים במרחב הציבורי. אכן, החל מה- 26 במרץ כמות המגעים מחוץ למשפחה הצטמצמה בצורה דרמטית (ראה להלן תרשים מס' 8 הלקוח מתוך דו"ח של מכון גרטנר). 

תרשים מס' 8: כמות המגעים הממוצעת לכל חולה בחלוקה למגעים בתוך המשפחה ומחוצה לה (הדבקות בישראל). התרשים לקוח מתוך דו"ח "שלב ההקלה או אסטרטגיית היציאה" של מכון גרטנר

עם זאת, יש לזכור שאינטנסיביות המגעים בתוך הבית גדלה מאוד. המשך הורדת המגעים בחוץ כבר כמעט לא תורמת להורדת כמות המגעים הממוצעת שכן התרומה של מגעים אלו היא כבר נמוכה מאוד. מצד שני, סגר מגביר משמעותית את זמן הנוכחות המשותפת במסגרת הביתית ובכך מגביר את קצב ההדבקה המשפחתית בקבוצות שם מתרחשים רוב המגעים. יתכן, שגודל המשפחה הוא אחד הגורמים הקובעים את השונות בקצבי ההדבקה בקהילות שונות. לפי ניתוח שהובא בעיתון הארץ, לדוגמה, כמחצית מהחולים בירושלים ובבני ברק מגיעים מבתים עם חולה נוסף מלבדם. בפוסט הקודם הצענו בדיקה פשוטה של כמות ההדבקות בתוך הבית לעומת הדבקות מחוץ לבית – בדיקה שתאפשר לאמוד אם צעדי הבידוד של האנשים בביתם מסייעים למיגור המגיפה או רק מחמירים אותה. מתרשים מס' 9 להלן, שלקוח אף הוא מתוך דו"ח של מכון גרטנר, אנו למדים כי השיעור היחסי של הדבקות בתוך הבית אכן נמצא במגמת עלייה ברורה.

תרשים מס' 9: החלוקה היחסית בין מקומות ההידבקות לאורך הזמן. התרשים לקוח מתוך דו"ח "שלב ההקלה או אסטרטגיית היציאה" של מכון גרטנר. 

ניתן להעלות טענה שהדבקה בתוך הבית לא תתפשט מעבר לבית וכך המגיפה תוגבל לבתים הנגועים בלבד, אולם טענה זו תקפה למקרה היפותטי של אפס מעבר בין בתים – מקרה שלא מייצג את המציאות. כמו כן, ההנחה שהמודל הסיני – בו בידוד של משפחות הועיל – תקף גם בישראל, היא הנחה בעייתית שכן בסין המשפחות קטנות, בישראל המשפחות גדולות בערך פי שתיים.  

שימוש בלמידת מכונה – השפעות של הטיות בדאטה שפורסם והמלצות לתיעוד מידע על נבדקים (עריכה מאוחרת)

לאחר פרסום פוסט זה התפרסמה ההבהרה הבאה מטעם צוות תמנ"ע של משרד הבריאות. המשמעות של ההבהרה היא, להבנתנו, שיש הטיה חזקה בנתונים שפורסמו, הטיה הנובעת מצורת התיעוד. ההטיה הינה לדיווח יתר של תסמינים בקרב הנבדקים החיוביים, ודיווח חסר של תסמינים בקרב הנבדקים השליליים. לפיכך, סביר להניח שהביצועים של המודל שאומן על ידינו על הנתונים שפורסמו יהיו שונים בצורה משמעותית ביחס להפעלתו על נתונים שלא סובלים מההטיה הזו. 

עם זאת, נדגיש כי ישנן מגוון שיטות לצמצם את השפעתן של הטיות מסוג אלו וכי טיוב הנתונים ומערך התיעוד שלהם צפוי להוביל לשיפורים משמעותיים בביצועי המודל. 

ההבהרה שפורסמה ע"י צוות תמנ"ע במשרד הבריאות (13 באפריל 2002):

הבהרה חשובה לגבי התסמינים:
1. התסמינים מבוססים על סמך דיווח אישי.
2. ישנה הטיית דיווח מובנית בתסמינים: המידע נאסף בצורה שונה בקרב החיוביים והשליליים.
בקרב החיוביים – נעשתה חקירה אפידמיולוגית מקיפה, ששאלה באופן ספציפי לגבי התסמינים.
בקרב השלילים – המידע לא נאסף בצורה עקבית ולא על ידי שאלות ישירות.
3. האינדיקציות לבדיקה השתנו לאורך הזמן, וסימנים קליניים לא תמיד היוו אינדיקציה לביצוע הבדיקה (לדוגמא, בתחילת ההתמודדות עם הנגיף, חזרה מארצות מסוימות או מגע עם מודבק מאומת לא דרשו הופעת סממנים לשם ביצוע הבדיקה).
4. ישנם סקרים שבוצעו בקרב אוכלוסיות נבחרות (כמו למשל עובדי בריאות) ובמהלכם נמצאו מודבקים. בסקרים אלו אין תיעוד לתסמינים הקלינים.
5. יש לציין שקיימת עדות בספרות לכך שחלק מהנבדקים הם א-סימפטומטיים.

על מנת לצמצם את ההשפעה של ההטיה הזו ועל מנת להבשיל מודל למידת מכונה חישובית שיאפשר תעדוף חכם של הבדיקות ויחליף בדיקות שתוצאתן ניתנת לחיזוק בדיוק גבוה – נמליץ על ביצוע הצעדים הבאים:

  1. שמירת היסטוריית התיעוד של כל נבדק ופרסומה. הסבר: לפי ההבהרה של צוות תמנ"ע, הנתונים של כל נבדק חיובי למעשה מתועדים פעמיים – פעם אחת קרוב למעמד הבדיקה (לפני שידועה תוצאת הבדיקה) ופעם שניה לאחר קבלת תוצאת הבדיקה החיובית והשלמת החקירה האפידמיולוגית. התיעוד הראשון הינו תיעוד לא עקבי ולא על ידי שאלות ישירות, התיעוד השני מקיף יותר (כך לפי הודעת המשרד). המצב כרגע בנתונים שפורסמו הינו שהתיעוד השני דורס את התיעוד הראשון כך שעל הנבדקים החיוביים מתפרסם רק התיעוד השני. פרסום של התיעוד הראשון החלקי של כל נבדק, גם של הנבדקים החיוביים, לצד התיעוד השני המקיף של הנבדקים החיוביים – יאפשר לאמוד בצורה מדויקת את השפעתה של הטיה זו. באופן כללי, אם יש יותר מ- 2 תיעודים מומלץ לפרסם את כולם ולא רק את האחרון, זה יאפשר לאמוד הטיות דיווח ולצמצם אותן. 
  2. תיעוד מאפיינים ומדדים נוספים לכל נבדק, ובפרט:
    • תיעוד מפורט ומובנה של האינדיקציה שהובילה לקיום הבדיקה:
      • אינדיקציה מסוג מגע עם חולה מאומת – כמות המגעים, משך המגעים, מועדי המגעים, סוג הקשר (משפחתי / עבודה / אחר). 
      • אינדיקציה מסוג חזרה מחו"ל – תאריך החזרה והיעד ממנו חזר.
      • בדיקות שגרתיות (צוותים רפואיים, עובדים שמוגדרים כקריטיים וכו') – סוג הבדיקה השגרתית.
      • בדיקות ייעודיות (בתי אבות, ערים/שכונות עם תחלואה גבוהה) – תיעוד סוג הבדיקה היעודית.
      • האם הגיע לבדיקה מבידוד? אם כן משך הבידוד וסיבתו.
    • תיעוד מאפייני רקע של הנבדק: גיל, מין, מקום מגורים, מחלות רקע, עישון, כמות מבוגרים/ילדים נוספים בתא המשפחתי, מקצוע.
    • תיעוד ברזולוציה גבוהה יותר של התסמינים: מועד מדויק של הופעת התסמינים, הוספת מדד כמותי לכל תסמין (לא רק כן/לא חום אלא גם טמפ' של מדידת חום אחרונה ומקסימלית), קיטלוג ברזולוציה יותר גבוהה של כל תסמין (לא רק כן/לא שיעול אלא שיעול יבש/שיעול לח).
  3. שימוש בטפסי דיווח דיגיטליים פשוטים לקבלת תיעוד מדויק של מאפייני רקע ומאפיינים וקליניים של כל נבדק על בסיס דיווח עצמי. בדומה לשאלון שפותח ע"י מכון ויצמן ומוכוון לאוכלוסייה הכללית, ואולי אף כהרחבה שלו, מומלץ לשלוח לכל נבדק לקורונה טופס למילוי עצמי (בטכנולוגיה פשוטה וזמינה דוגמת Google Forms או Chatbot) – ולבקש ממנו לדווח מאפייני רקע ומאפיינים קליניים טרם ביצוע הבדיקה. נדגיש כי אנחנו ממליצים שדיווח זה יהיה בנוסף לתיעוד המתבצע כיום ולא במקומו. דיווח שכזה, גם אם ימלאו אותו רק 10% מהנבדקים, יספק מקור נוסף לקבלת נתוני רקע ונתונים קליניים על הנבדקים ולהשתמש בנתונים האלו כדי לטייב את המודל וכדי לאמוד ולצמצם את השפעותיהן של ההטיות האחרות. 

הפוסט נכתב ע"י פרופ' יורם לוזון מהמחלקה למתמטיקה באוניברסיטת בר אילן, פרופ' לב מוצ'ניק, ראש תחום מדעי המידע בבית הספר למנהל עסקים באוניברסיטה העברית בירושלים ועומר קורן, מנכ"ל חברת ווביקס.

פרופ' לוזון מתמחה באפידמיולוגיה ואימונולוגיה מתמטית, תהליכים סטוכסטיים ותורת הגרפים.

פרופ' מוצ'ניק חוקר איך התנהגויות של אנשים, הרגלי צריכה, ודעות מתפשטים במרחב החברתי, ובפרט כיצד תבניות ההתפשטות תלויות בפלטפורמות דיגיטליות ובמדיה החברתית. חלק ניכר ממחקרו מוקדש לניתוח נתוני עתק של התנהגות אנושית ופיתוח שיטות מתקדמות להפקת תובנות מנתונים אלו.

עומר קורן עוסק בלמידת מכונה, דאטה-סיינס ומחקר רשתות. 

הניתוחים שהובאו בפוסט זה הועשרו על ידי הערות ונתונים בקבוצות הדיון של מפא"ת ובעיקר על ידי ד"ר עמית רכבי, ד"ר רמי פוגץ' ואלישע סטואין.

הפוסט מתפרסם כחלק מפעילות צוות מחקר ו- AI שפועל מטעם מפא"ת.