หัวข้อวันนี้จะเป็นการappraiseงานวิจัยที่มีการใช้Survival analysisนะครับ ซึ่งได้เกริ่นนำไว้บ้างแล้วใน Part1

tabwhiteก่อนอื่นขอย้ำอีกครั้งว่าSurvival analysisเป็นวิธีการวิเคราะห์ข้อมูลที่[ตัวแปรตามเป็นTime-to-event]และมี[Right Censoring]ซึ่งสามารถพบการวิเคราะห์เช่นนี้ได้ในทุกรูปแบบการศึกษาทั้งcohort, case-control, RCT และeventที่สนใจไม่จำเป็นต้องเป็นDeath อาจเป็นเวลาหายจากโรค เวลานอนรพ. เวลาก่อนมะเร็งกลับเป็นซ้ำ ก็ได้ทั้งสิ้น ดังนั้นในการอ่านงานวิจัยก็ยังต้องใช้หลักในการappraiseของแต่ละรูปแบบงานวิจัยอยู่เช่นเดิม โดยเสริมประเด็นของSurvival Analysisเข้าไปด้วย จะขอแบ่งประเด็นดังนี้ครับ
tabwhite1. Left truncation: late entry bias
tabwhite2. Survival curve: tricky points & pit falls
tabwhite3. Statistical tests: Log-Rank Test & Cox Proportional Hazard Regression
tabwhite4. Interpretation of results


tabwhite1. Left truncation: late entry bias
tabwhiteลองย้อนยุคไปซะหน่อยนะครับ สมัยที่ความรู้เรื่องHIVยังไม่ดี นักวิจัยกลุ่มหนึ่งอยากจะศึกษาprognosisของคนไข้ติดเชื้อHIV ว่าจะเปลี่ยนแปลงไปเป็นAIDSเมื่อไร คนไข้ที่เข้าร่วมงานวิจัยก็คือคนไข้ที่เพิ่งวินิจฉัยใหม่จากคลินิกที่นักวิจัยตั้งขึ้น ปัญหาก็คือได้ n น้อยเหลือเกินนักวิจัยจึงตัดสินใจประกาศว่า ถ้าใครรู้ตัวว่าเป็นHIV ถ้ายอมมาขึ้นทะเบียนเข้าร่วมงานวิจัยก็จะได้การดูแลสุขภาพทั่วๆไปฟรี หลังประกาศออกไปก็ค่อยๆมีคนไข้ทยอยมาเข้าร่วมงานวิจัย บางคนติดเชื้อHIVมาแล้วเป็นเดือน บางคนก็เป็นปี บางคนเป็นAIDSอยู่แล้วก็จะตัดออกจากการศึกษา (คนที่eventเกิดก่อนเข้าร่วมงานวิจัยแบบนี้เรียกว่า Left Censoring ซึ่งไม่ใช่ประเด็นของเรา) สำหรับคนที่เหลือนักวิจัยก็ทำการบันทึกข้อมูลตามภาพข้างล่างนี้

surv21.png

tabwhiteในความเป็นจริงคนไข้แต่ละคนรู้ตัวว่าติดHIVคนละเวลากัน(ภาพซ้าย)  แต่ในงานวิจัยนี้ถือว่าวันที่วินิจฉัยเป็นวันที่เริ่มติดตามเพื่อดูการเปลี่ยนแปลงไปเป็นAIDS (ถ้าใครคิดตาม จะเห็นว่ามีbiasเยอะมาก เพราะ ณ วันที่วินิจฉัยแต่ละคนก็ติดเชื้อมานานไม่เท่ากัน แถมไม่รู้ว่าคนไหนบ้างที่ตรวจเจอจากการคัดกรอง คนไหนตรวจเพราะมีอาการ ฯลฯ แต่ไม่เป็นไรครับ ทั้งหมดที่ว่ามานี้ยังไม่ใช่ left truncation) พอถือวันวินิจฉัยเป็นวันเริ่มต้น นักวิจัยก็จะบันทึกเสมือนว่าคนไข้ทุกคนเริ่มวินิจฉัยในวันเดียวกัน(ภาพขวา) แล้วติดตามต่อไป … สำหรับคนที่มาเข้าร่วมงานวิจัยหลังจากทราบวินิจฉัยแล้ว จะเห็นได้ว่าเราไม่สามารถย้อนเวลาไปดูได้ว่า”ก่อนมาเข้าร่วมงานวิจัยเค้าเป็นAIDSรึเปล่า?” ถ้าเกิดeventที่เราสนใจคือการตายก็จะกล่าวว่า “ก่อนมาเข้าร่วมงานวิจัยไม่รู้ว่าตายมาก่อนแล้วรึเปล่า?” ซึ่งคงฟังดูไร้สาระมากใช่ไหมครับ ดังนั้นวิธีการที่ common sense ก็คือถือว่าเขายังไม่เป็นAIDSน่ะแหละ … ก็ฟังดูถูกต้อง แล้วมันเกิดปัญหาอะไรล่ะ? ลองดูภาพข้างล่างนี้ครับ ผมได้เพิ่มคนบางคนเข้าไป

sruv22.pngtabwhiteจะเห็นได้ว่าในบรรดาคนที่ติดHIVนั้น บางคนเป็นRapid progressor กลายเป็นAIDSอย่างรวดเร็ว บางคนตาย ตายตั้งแต่ก่อนจะมาเข้าร่วมงานวิจัย นั่นก็แปลว่าถ้าผู้วิจัยสนแต่“คนที่เข้าร่วมทีหลัง” คนพวกนี้เสมือนได้รับการพิสูจน์มาแล้วว่าไม่เกิดeventขึ้นในช่วงearlyของโรคที่สนใจ ก็จะทำให้เกิด “late entry bias” จัดเป็นselection bias ชนิดหนึ่ง ซึ่งทำให้prognosisของคนไข้ HIV ดูดีเกินจริง … การจัดการกับ Left truncation นั้นจะมีวิธีทางสถิติอยู่ อย่างไรก็ตามไม่สามารถกำจัด bias ได้ทั้งหมด ผมจะไม่พูดถึงวิธีการที่ว่าแต่อยากให้มองหาว่ามี bias ชนิดนี้อยู่ในงานวิจัยหรือไม่ และผู้วิจัยตระหนักถึงและมีวิธีจัดการอย่างไร


tabwhite2. Survival curve: tricky points & pit falls
tabwhiteลองดูKaplan-Meier 4 ภาพนี้นะครับว่าคิดยังไงบ้าง

abcd.pngtabwhite2.1) แกนY
tabwhiteทั้ง4ภาพมาจากข้อมูลชุดเดียวกัน เทียบคู่A-B ก่อน จะเห็นว่าscaleของแกนY นั้นไม่เท่ากันคือBจะZoomกว่าA ทำให้ดูเหมือนว่าความต่างระหว่าง2กลุ่มนั้นต่างกันเยอะ ทั้งที่จริงๆแล้วต่างกันนิดเดียว อันนี้เป็นลูกเล่นทั่วไปที่นักนำเสนอมักทำอยู่แล้วกับกราฟใดใดก็ตามนะครับ ถามว่าผิดไหม? ผมก็คิดว่าขึ้นอยู่กับเจตนานะครับ เราในฐานะผู้เสพย์ก็ไม่ควรพลาดกับเรื่องโง่ๆเช่นนี้ ประเด็นถัดมาเกี่ยวกับแกนYก็คือ จะวาดกราฟวิ่งขึ้นหรือวิ่งลงดีกว่ากัน ถ้าวิ่งลงก็เป็นการดูจำนวนคนที่ยังไม่เกิดevent แต่ถ้าวิ่งขึ้นก็เป็นการดูคนที่เกิดeventแล้ว ซึ่งก็ถูกต้องทั้งคู่ อย่างไรก็ตามในกรณีที่eventเกิดน้อยๆเช่นข้อมูลชุดนี้ ถ้าเรานำเสนอโดยเอากราฟวิ่งขึ้นแล้วซูมเข้าแบบในภาพD จะสังเกตว่าแกนYยังคงเริ่มจาก0เหมือนเดิม เมื่อเทียบกับBที่แกนYมีการปรับเลขที่ฐานแล้ว Dก็จะดูน่าเชื่อถือกว่าB นะครับ (ถ้าจะให้ถูกBต้องมีสัญลักษณ์ยึกยือด้วยที่ฐานของแกนY) … แต่สรุปอีกครั้งว่าในฐานะผู้อ่าน ทั้งสี่แบบไม่ผิดนะครับ

tabwhite2.2) แกนX
tabwhiteพูดเรื่องแกนYไปแล้ว ถัดมาเป็นเรื่องแกนXครับ ลองดู2ภาพนี้ ซึ่งมาจากข้อมูลชุดเดียวกันครับ
abcd
tabwhiteภาพA ตั้งแกนXไว้ถึง400วัน ในขณะที่Bตั้งไว้ถึงแค่200วัน ภาพที่ต่างกันก็คือจะเห็นว่าช่วงท้ายๆมีการ Crossกันของสองกลุ่มในA ซึ่งไม่ปรากฎให้เห็นในฺBนะครับ อยากให้ลองคิดดูก่อนว่าอันไหนถูกต้องกว่ากัน? Bจงใจหมกเม็ดใช่หรือไม่?
tabwhite
tabwhite
tabwhite
tabwhiteก่อนจะเฉลย ผมอยากบอกว่าข้อมูลชุดนี้ผมจำลองขึ้นมาเองโดยให้Hazard Ratioของกลุ่มสีเขียวเทาต่อกลุ่มสีแดงเป็น1.2ตลอดทั้งกราฟ โดยมีloss-follow up (ก็คือcensor)ประมาณ40% แล้วก็กดจำลองข้อมูลอยู่ประมาณ4รอบก็ได้กราฟที่ต้องการออกมา … ในเมื่อเป็นข้อมูลจำลองตามเงื่อนไขทุกอย่างก็ไม่น่าจะเกิดการCrossกันแบบในภาพAได้ใช่ไหมครับ? คำอธิบายภาพAก็คือ ถ้าย้อนไปอ่าน Part1 (เรียกพฤติกรรมนี้ว่า self reference นะครับเป็นวิธีการเพิ่ม citation ของตัวเอง ไม่ควรเอาเป็นเยี่ยงอย่างบ่อยเกินไปนัก) ผมบอกไว้ว่า“ทุกครั้งที่มีคนcensor น้ำหนักของการเกิดeventในคนหลังๆจะมากขึ้นเพราะตัวหารน้อยลง เสมือนว่าคนที่โดนcensorไม่ได้อยู่ในงานวิจัยแล้ว” ดังนั้นยิ่งมีการCensorมากเท่าไร+ยิ่งไปตอนปลายของกราฟมากเท่าไร “Sample size” จะน้อยลงมากๆ และsample sizeที่น้อยก็คือความUnreliable นั่นเองครับ
tabwhiteพูดได้อีกอย่างหนึ่งก็คือ ข้อมูลตอนปลายของ Survival curve มักจะมีความสำคัญน้อยและไม่น่าเชื่อถือ ลองดูปลายหางกลุ่มเขียวเทาในภาพAก็ได้ครับ ตอนจบวิ่งเป็นเส้นตรงแล้วอยู่ๆก็ปักหัวไปเลย น่าเกลียดมาก อธิบายได้จากช่วงหลัง 250วัน คนเหลือน้อยมาก มีแต่คนloss-follow up จนตอนจบมีคนเกิดevent 1 คนกราฟก็ร่วงจมดินไปเลย … ดังนั้นผู้นำเสนอที่ดีควรทำอะไรก็ได้เพื่อเปิดเผยให้ผู้อ่านรู้ว่ามีการcensorเกิดขึ้นมากน้อยขนาดไหน ซึ่งเราจะพูดถึงในหัวข้อ 2.3)
tabwhiteแต่ตอนนี้กลับมาที่Bก่อน ผมกำลังจะบอกว่าสิ่งที่Bทำ คือการ”ตัดจบ”หรือที่ภาษาการ์ตูนเรียกว่า”ปาหมอน”นั้นถูกต้องใช่หรือไม่? คำตอบคือ ทั้งใช่และไม่ใช่ ในกรณีที่การศึกษาถูกออกแบบมาโดยตั้งใจจะติดตามดูผู้ป่วยสมมติว่า 5 ปีนับจากวันเข้าร่วมวิจัย ในความเป็นจริงผู้ป่วยแต่ละคนเข้าการศึกษาไม่พร้อมกัน บางทีกว่าจะรวบรวมผู้ป่วยได้ตามจำนวนที่ต้องการอาจใช้เวลาหลายปี ดังนั้น ณ วันที่ผู้ป่วยคนสุดท้ายที่เข้างานวิจัยได้รับการติดตามครบ5ปี ผู้ป่วยบางคนอาจจะได้รับการติดตามไปแล้ว7-8ปี ซึ่งกราฟช่วงหลัง5ปีเนี่ย มักจะมีคนเหลืออยู่น้อยมากและพังๆดังภาพAที่ยกตัวอย่างมา ด้วยเหตุนี้ในกรณีที่ระบุเวลา5ปีไว้ก่อนแล้วเนี่ย การตัดจบที่5ปี (แม้ว่าบางคนในการศึกษาจะให้ข้อมูลเราได้มากกว่า5ปีก็ตาม) ก็เป็นการกระทำที่ชอบธรรม (ลองคิดถึงการ์ตูนในตำนานหลายเรื่องที่ออกทะเลตอนใกล้จบสิครับ ส่วนใหญ่พวกเนี้ยเพราะขายดี นักเขียนเลยถูกบีบให้ยื้อเรื่องออกไปกว่าที่วางแผนไว้ เลยกลายเป็นพังตอนท้าย …ฉันใดก็ฉันนั้น) ทีนี้ถ้าไม่ได้มีlimitไว้ก่อนว่าจะติดตามถึงแค่ 5 ปี ในกรณีนี้ผมก็คิดว่าผู้นำเสนอสามารถตัดจบได้นะครับ เพราะการปล่อยให้ปลายกราฟAออกมาเพ่นพ่านนั้นเป็นข้อมูลที่misleading แต่ที่สำคัญก็คือผู้นำเสนอต้องบอกให้ชัดเจนว่ามีการเล็มแกนXออก ด้วยเหตุผลอะไรก็ว่าไป (เคยมีexpert opinionว่าถ้าเหลือsubject<20%ของNเดิม น่าจะพิจารณาตัดแกนX ซึ่งผมว่าต้องดูเป็นกรณีไป) ในทางกลับกันถ้าวางแผนไว้ว่าจะติดตาม5ปี แล้วตัดจบก่อนหน้านั้นเนี่ย มักจะมีกลิ่นตุๆนะครับ ต้องระวัง
tabwhiteสรุปว่าแกนX จะนำเสนอยาวถึงไหนนั้นมีได้หลายแบบ ถ้านำเสนอสั้นๆ ต้องดูว่าตรงกับที่เขาdesignไว้ไหมถ้าไม่ตรง เพราะอะไร ถ้านำเสนอยาวๆ ก็ระลึกไว้ว่าตอนปลายกราฟจะไขว้กัน จะดิ่งเหว ก็อย่าไปอะไรมากแมน (คิดถึงเพจนี้)

tabwhite2.3) Censoring disclosure
tabwhiteการcensorไม่ใช่สิ่งที่ผิด แต่ต้องเปิดเผย คำว่าเปิดเผยในที่นี้คือเปิดเผยปริมาณและเปิดเผยสาเหตุ เรามาดูที่ปริมาณกันก่อนว่าสามารถแสดงให้เห็นอย่างไรได้บ้าง
abcd
tabwhiteวิธีแรกคือการแสดง marker ของcensoringลงไปบนกราฟ ซึ่งผมแถมเส้นประ95%CIให้ด้วย สังเกตกราฟAนะครับ censorน้อย(10%) แถบ95%CIก็จะแคบ แสดงว่าข้อมูลน่าเชื่อถือ ส่วนกราฟB censor40% แถบ95%CIก็เลยบานออก วิธีนี้ก็ชัดเจนดี แต่บางทีก็ดูรก ยิ่งถ้ามีหลายกลุ่มเปรียบเทียบ มีcensorเยอะๆ กราฟเบียดๆกัน จะดูไม่จืดเลยทีเดียว

unnamed-chunk-7-1
//ตัวอย่างจาก http://r-addict.com/2016/05/23/Informative-Survival-Plots.html

tabwhiteวิธีที่2ที่นิยมกันคือการเขียนเป็นตัวเลขลงไปใต้แกนX ซึ่งมีหลายรูปแบบในรายละเอียด แต่ที่นิยมกันจะเป็นการเขียนว่า number at risk ในแต่ละจุดเวลาเป็นเท่าไร คนอ่านก็พอจะประเมินได้ว่ามีcensorเยอะหรือไม่ ข้อมูลยังน่าเชื่อถือหรือไม่
tabwhiteอีกประเด็นที่สำคัญไม่แพ้ปริมาณการcensor ก็คือสาเหตุ … การcensorที่จะไม่ทำให้การวิเคราะห์ผิดเพี้ยนไปนั้นจะต้องเป็น random censor กล่าวคือคนที่โดนcensorกับคนที่ไม่โดนcensorนั้น มีprognosisใกล้เคียงกัน เช่น ถ้าเราศึกษาเรื่องNSAIDsกับGI bleed แล้วเราcensorคนที่”หยุดกินยา”ไป ซึ่งถ้าเขาหยุดกินยาเพราะมีอาการปวดแสบท้อง หรือบางคนตายโดยไม่ทราบเหตุ คนพวกนี้ถ้าใช้ยาต่อก็น่าจะเกิดGI bleedได้การcensorจึงมีแนวโน้มจะทำให้ดูเหมือนมีGI bleedน้อยลง หรือถ้าเป็นการตรวจติดตามคนไข้ประจำปีแล้วอยู่ๆคนส่วนนึงหยุดตรวจไป ก็อาจเป็นได้ทั้งในกรณีที่เขาสบายดีมากๆ จนขี้เกียจมาตรวจ หรือป่วยหนักมากจนไม่อยากออกจากบ้าน การcensorในกรณีนี้ล้วนมีผลกระทบต่อผลการศึกษาทั้งสิ้น
tabwhiteแล้วถามว่าunplanned censorที่ไม่มีผลกระทบต่อoutcomeเลยนั้นมีหรือไม่ ผมคิดว่ามีน้อยมาก ดังนั้นแม้ Survival analysis จะมีกระบวนการจัดการกับข้อมูลที่censorไป แต่การcensorที่ไม่ได้เกิดจากการจงใจตัดจบการศึกษานั้นยิ่งมีมากก็ยิ่งไม่ดี อย่างไรก็ตามถ้ามีการแจกแจงเหตุผลมาผู้อ่านก็จะสามารถคิดวิเคราะห์ได้ว่ามันน่าจะสำคัญหรือไม่ ในกรณีที่มีกลุ่มเปรียบเทียบแล้วเราพบว่าการcensorเกิดขึ้นใน2กลุ่มไม่เท่ากันแบบนี้เป็นสัญญาณบอกว่าcensorแหม่งๆแล้วนะครับ

สรุปตรงนี้ว่า การนำเสนอกราฟมานั้น ต้องดูแกนY ปลายแกนX จำนวนและสาเหตุที่censorดีๆนะครับ


tabwhite3. Statistical tests: Log-Rank Test & Cox Proportional Hazard Regression
tabwhiteขอย่อว่าLRNKกับCOXPH; LRNKนั้นเป็นการทดสอบเพื่อ reject Null hypothesisว่า “survival curve ของ 2กลุ่ม(หรือมากกว่า)ไม่แตกต่างกัน) ถ้า p value ออกมา<0.05ก็สรุปว่าแต่ละกลุ่มมีsurvival curveต่างกัน ไม่งั้นก็แปลได้แค่ว่า “ไม่พบว่าแตกต่างกันอย่างมีนัยสำคัญทางสถิติ” ตามฟอร์มเดิม … ส่วนCOXPHเป็น multivariable regression รูปแบบหนึ่งข้อดีคือสามารถได้ค่า hazard ratio ของตัวแปรต้นออกมาด้วย และสามารถadjust effect ของตัวแปรร่วมอื่นๆได้
tabwhiteสิ่งสำคัญที่ต้องทราบคือ assumption ของทั้ง2test ว่าเราจะเชื่อผลลัพธ์ได้เมื่อไร ซึ่งทั้ง LRNKกับCOXPH มีassumptionที่สำคัญคล้ายๆกันนั่นก็คือ
tabwhite3.1) โอกาสที่จะcensorไม่สัมพันธ์กับprognosis/outcome ข้อนี้เหมือนที่เราบอกไปแล้ว เรามีคำศัพท์ว่า “non-informative censoring”
tabwhite3.2) survival ของ early กับ late recruited ใกล้เคียงกัน ข้อนี้ดูเผินๆเหมือนจะพูดถึง Left truncation / Late entry bias แต่จริงๆไม่ใช่ครับ ความหมายคือ คนที่เรานำเข้าการศึกษาในแต่ละช่วงควรมีprognosisคล้ายๆกัน ยกตัวอย่างที่violate assumptionนี้คือ เราศึกษาการเกิดมะเร็งของคนญี่ปุ่นโดยเก็บข้อมูลตั้งแต่เกิดมาหลายปี อยู่ๆทำไปทำมาโรงไฟฟ้านิวเคลียร์ดันรั่วซะงั้น คนที่เกิดในละแวกนั้นหลังจากเหตุการณ์อันน่าเศร้าก็ย่อมมีโอกาสเกิดมะเร็งต่างกับคนที่เกิดก่อนมีอุบัติเหตุ เรามีคำศัพท์อีกว่า “No secular change”
tabwhite3.3) Hazard ratio ต้องค่อนข้างคงที่ตลอดช่วงที่ติดตาม เช่น คนที่รักษาโดยการผ่าตัดซึ่งตายเร็วช่วงแรกแต่พอช่วงหลังกลับบ้านก็อายุยืนยาว มาเทียบกับคนที่ได้ยาเคมีซึ่งไม่ค่อยตายช่วงแรกๆ แต่ไปแย่กว่าในตอนท้าย สองกลุ่มนี้ survival curveจะไขว้กัน และเรามองด้วยตาก็มองออกว่ามันไม่เหมือนกันแน่ๆ แต่LRNKอาจให้ p value >0.05 นะครับ ส่วนCOXPHยิ่งเจ๊งเลย วิธีนึงที่ทำได้คือแบ่งsurvivalเป็นสองส่วนแล้วแยกกันวิเคราะห์


tabwhite4. Interpretation of results
tabwhiteHazard เป็นค่าที่โดยส่วนตัวผมคิดว่าจินตนาการและสื่อสารยากอยู่ สมมติ Hazardที่เวลา2ปี = 10% แปลตรงตัวก็หมายความว่า ถ้าคุณมีชีวิตอยู่มาถึง2ปี ณ ขณะนั้นๆ คุณจะมีโอกาสตาย 10% ซึ่งถ้าอยู่รอดไปได้อีกปี Hazard ก็ไม่เท่าเดิมด้วยนะ
tabwhiteHazard ratio ยิ่งสื่อสารยาก สมมติ HRระหว่างคนกินยาAเทียบกับยาB =2 หมายความว่า ถ้าคุณกินยาAมาเป็นเวลาเท่าๆกับอีกคนที่เป็นยาB แล้วยังไม่เกิดeventขึ้น ณ ขณะนั้นๆคุณมีโอกาสเกิดeventเป็น 2 เท่าของอีกคน
ดังนั้นสำหรับหมอเราต้องแปลผลให้ถูก แต่ผมคิดว่าถ้าคุยกับผู้ป่วย เปลี่ยนข้อมูลให้กลายเป็น median survival time หรือ X-year cumulative survival rate จะแปลได้ง่ายกว่า เช่น ถ้าคุณยังไม่ลดความอ้วนนะ (ค่ามัธยฐาน)อายุขัยของคุณจะสั้นลงกว่าคนอื่นเค้า 10 ปี!

tabwhiteขอจบการ appraise survival analysis แต่เพียงเท่านี้ อยากสอบถาม/เสนอแนะ/แก้ไขความเข้าใจผิด กรุณาด้วยนะครับ


Edited: มีคนหลังไมค์มาว่าอยากให้เพิ่ม check list ในการ critical appraise ให้ด้วย ผมก็เลยเรียบเรียงใหม่แบ่งหมวดหมู่เหมือน check list ทั่วไป ดังนี้ครับ (หา check list ที่คนอื่นทำไว้ไม่ค่อยได้อ่ะ)

Are the results VALID?
– Is the index date (start time) appropriate?…เวลาเริ่มเหมาะสมกับ exposure และ outcome
– Are events and time measured accurately?…วัด outcome อย่างไร เวลาแม่นยำไหม, recall?
– Is there a risk of late entry bias?…ระยะเวลาระหว่างindex dateกับentry date มีผลอย่างไร
– Is there a possible change in secular trend?…มีปัจจัยอื่นๆที่มีผลกับoutcomeเกิดขึ้นใหม่ในระหว่างการศึกษา (เช่น มีการรักษาใหม่ๆเกิดขึ้นในขณะที่กำลังติดตาม survival ของคนไข้มะเร็ง)

What are the results?
– Is the y-axis truncated?…แกนyโดนย่ออย่างเหมาะสมหรือเปล่า
– How long is the x-axis extended?…แกนxโดนย่ออย่างเหมาะสมหรือเปล่า
– How many were censored, and are they informative?…censorเยอะไหม เพราะอะไร
– Have the assumptions of statistical methods been met?…เช่น ถ้ากราฟตัดกันจริงๆ ไม่ควรใช้ LRNK, COXPH

Can we apply the results to our patients?
– Interpretation of HR & Median survival time…แปลผลให้ถูก บางการศึกษาแปลHRเป็นRR ซึ่งมันไม่ใช่ (ยกเว้นไม่มีการcensorเลยนอกเหนือจากตอนจบstudy กรณีนั้นจะใกล้เคียงกันมาก)

Advertisements