Cohort (N.)
   – A unit of warriors from Roman legion
– A group of people used in a study who have something in common

tabwhite‘Cohort’ โดยทั่วไปหมายถึงกลุ่มคนที่มีคุณลักษณะบางอย่างร่วมกัน เช่น เป็นคำเรียกหน่วยทหารของโรมัน cohortพนักงานการไฟฟ้า cohortผู้รอดชีวิตจากสึนามิ cohortผู้สูงอายุในจังหวัดลพบุรี cohortผู้ป่วยHIV จะเห็นได้ว่าลักษณะที่ share กันนั้น อาจเป็น โรค อาชีพ ถิ่นที่อยู่ ปีเกิด (birth cohort) หรือประสบการณ์ร่วมกันก็ได้tabwhiteในทางงานวิจัย เมื่อเราพูดถึง cohort แปลว่าเราต้องมีการเก็บข้อมูลของกลุ่มบุคคลนั้นๆ แบบไปข้างหน้าและเป็นระบบ ส่วนใหญ่จะมี outcome ที่สนใจศึกษาจะเกิดขึ้นในอัตราเท่าไร (incidence) ดังนั้น สมาชิกใน cohort ควรจะยังไม่มี outcome ที่สนใจเกิดขึ้นในตอนเริ่มศึกษา … เมื่อเราทำการศึกษากับ cohort ที่เรามีข้อมูลอยู่ การศึกษานั้นอาจเป็นการศึกษาแบบ descriptive ที่ไม่มีกลุ่มเปรียบเทียบ หรือวิเคราะห์แบบ cohort study, case control ที่เรียกว่า nested case control หรือดึง sample จาก cohort ที่เรามีข้อมูลพื้นฐานอยู่แล้ว มาทำ RCT ก็ได้เช่นกัน


tabwhite‘Cohort study’ หรือ ‘Cohort analysis’ หมายถึง longitudinal observational study ประเภทหนึ่ง ที่มีการวิเคราะห์หาความสัมพันธ์จากเหตุ (exposure) ณ จุดเวลาตั้งต้น ไปหาผลลัพธ์ (outcome) ในจุดเวลาสิ้นสุด ซึ่งจะตรงข้ามกับการศึกษาแบบ case-control study

Cohort analysis มีขั้นตอนและองค์ประกอบที่สำคัญคือ
tabwhite1. enroll a group of people at risk of developing outcome
tabwhite2. measure the exposure status
tabwhite3. follow up for an adequate time
tabwhite4. record the outcomes
tabwhite5. not intervene

tabwhite1. Enrollment
tabwhiteสิ่งที่สำคัญที่สุดคือคนที่จะเข้ามาใน cohort ต้องเป็นประชากรที่ at risk ต่อการเกิด outcome แปลว่าต้องสามารถเกิด outcome ได้และต้องยังไม่มี outcome เกิดขึ้น ณ ตอนเริ่มเข้า cohort เช่น เราคงไม่ศึกษาอุบัติการของ prostatic cancer ในประชากรเพศหญิง, ถ้าเราจะศึกษาอัตราการเกิด metastatic disease ของมะเร็งชนิดหนึ่ง เราก็ต้องตรวจก่อนว่าตอนเริ่ม cohort ยังไม่มี metastatic disease เกิดขึ้นแล้ว เป็นต้น
tabwhite เราสามารถ enroll subject ได้จาก general population หรือ specific population ก็ได้ ข้อดีของการ enroll จากประชากรทั่วไปคือความ generalizibility ของ result แต่ถ้า enroll จาก specific population ก็จะมี exposure ที่เราสนใจบ่อยขึ้น มีปัจจัยรบกวนลดลง และ follow up ได้สมบูรณ์มากขึ้น ทั้งนี้จะเลือกศึกษาจากประชากรแบบใดก็ขึ้นกับคำถามงานวิจัยของเรา เช่น ถ้าเราจะศึกษาเรื่อง repetitive head trauma กับความเสี่ยงการเกิด parkinson’s disease ถ้าเราเลือกศึกษาในประชากรทั่วไปอาจจะมี exposure rate ต่ำมาก ถ้าเลือกศึกษาในหมู่นักกีฬาแต่ละประเภทก็จะได้ exposure บ่อยกว่า

tabwhite2. Exposure
tabwhiteCohort analysis เป็น analytical study แปลว่าต้องมีการเปรียบเทียบ ซึ่งก็คือการเปรียบเทียบ outcome ที่สนใจระหว่างกลุ่มคนที่มี exposure status แตกต่างกัน โดยคู่เทียบนั้นอาจจะเทียบกับประชากรทั่วไป (เช่น อุบัติการ parkinson’s disease ในนักมวยไทยเทียบกับประชากรกรุงเทพฯ) เทียบภายใน cohort เดียวกัน (เช่น อัตราการเกิด stroke ในพนักงานการไฟฟ้าที่อ้วนเทียบกับไม่อ้วน) หรือเทียบกับ cohort คนละกลุ่มเลยก็ได้ (เช่น เทียบการเกิด COPD ในพนักงานการไฟฟ้ากับพนักงานโรงกลั่นน้ำมัน)
tabwhiteการวัด exposure สามารถวัดได้ 2 แบบ แบบแรกคือ static measurement จะวัดแค่ครั้งเดียวตอนเริ่มศึกษา ซึ่งแปลว่าเราตัดสินใจจะ ignore โอกาสที่ exposure นั้นจะหายไปขณะ follow up เช่น ความอ้วน หลังเริ่ม cohort subject ที่อ้วนอาจจะลดน้ำหนักสำเร็จก็ได้ ถ้าเราวัด exposure ครั้งเดียวก็จะไม่เห็นความเปลี่ยนแปลงนี้ (ในทางกลับกันกลุ่มที่ไม่อ้วนก็อาจจะอ้วนในภายหลังได้) การวัดอีกแบบหนึ่งคือ dynamic หรือ repeated measurement ซึ่งจะทำให้หน่วยของ exposure มีระยะเวลามาเกี่ยวข้อง (เช่น person-year)
tabwhiteรายละเอียดของการวัด exposure ก็มีตั้งแต่ category positive/negative, intensity, duration และ cumulative intensitity เช่น การสูบบุหรี่ อาจวัดเป็น สูบ/ไม่สูบ, สูบ 1 ซองต่อวัน, สูบมา 10 ปี, และสูบ 10 pack-year ตามลำดับ ซึ่งแบบหลังจะมีความซับซ้อนแต่มีข้อดีคือบอกได้ถึง dose-response relationship ซึ่งเป็นลักษณะที่สำคัญในการบอกความเป็นสาเหตุของ outcome

tabwhite3. Follow up
tabwhiteมีหลายวิธีในการติดตาม subject การตรวจเยี่ยมรายบุคคลจะน่าเชื่อถือที่สุดแต่ก็สิ้นเปลืองทรัพยากรมากที่สุด, การติดต่อทางไปรษณีย์นิยมใช้ในกรณีที่ติดตามด้วยแบบสอบถามก็จะสะดวกกว่า แต่ก็มีความไม่แม่นยำสูง ระยะหลังมีการใช้ระบบอิเล็กทรอนิกส์มาจัดการข้อมูลทางการแพทย์และประชากรมากขึ้น ก็เป็นแหล่งหนึ่งที่นิยมใช้ในปัจจุบัน ซึ่งความน่าเชื่อถือก็ขึ้นกับความแม่นยำและสมบูรณ์ของผู้บันทึกข้อมูลนั่นเอง
tabwhiteปัญหาสำคัญของ cohort analysis คือ loss-to-follow up ซึ่งมักเกิดขึ้นเสมอ แต่จะมีผลมากขนาดไหนก็ขึ้นกับ outcome ที่เราสนใจและวิธีวัดด้วย เช่น ถ้าเราสนใจอัตราตายภายใน 10 ปีและเราวัดการตายจากทะเบียนราษฎร์ (ซึ่งควรจะมีความน่าเชื่อถือ) ในกรณีนี้แม้จะ loss-follow up ไปหมด แต่เราก็สามารถมั่นใจได้ว่า subject ในการศึกษายังมีชีวิตอยู่หรือไม่ การ loss-follow up จึงไม่กระทบการวัด outcome (อาจถือว่าไม่ได้ loss-follow up)

tabwhite4. Outcome
tabwhiteoutcome ที่วัดมีหลายแบบตั้งแต่ all-cause mortality, cause-specific mortality, event of interest และอาจเป็นหลายๆ event ร่วมกันที่เรียกว่า composite outcome เช่น รวม MI, stroke, PAD, cardiovascular death เป็น composite cardiovascular outcome เป็นต้น ซึ่งมีข้อดีในการเพิ่ม power (เพิ่ม rate of outcome) แต่ต้องระมัดระวังในการแปลผลทางคลินิก
tabwhiteในกรณีที่มีหลาย outcome (เช่น composite CVD ดังกล่าว) หรือ outcome เกิดได้หลายครั้ง (เช่น การ admit) วิธีที่เรียบง่ายที่สุดคือ การสนใจแค่ outcome แรกที่เกิดขึ้น และให้ถือว่า subject นั้นเกิด outcome แล้ว ไม่ใช่ subject ที่ “at risk” อีกต่อไป
tabwhiteในกรณีของ binary outcome การรายงานผลที่ตรงไปตรงมาที่สุดคือ cumulative incidence (เช่น 10-year-mortality หน่วยเป็น case/time) ซึ่งจำเป็นที่ทุก subject ต้องมี common and complete follow-up time ในกรณีที่ มีการ loss-to-follow up, exposure status เปลี่ยนแปลง การรายงานเป็น incidence rate ที่มีหน่วยเป็น case / person-time จะเหมาะสมกว่า ซึ่งจะกล่าวถึงอีกครั้งในเรื่อง cohort แบบเปิดและแบบปิด

tabwhite5. No intervention
tabwhiteเนื่องจากเป็น observation study จึงไม่มีการเข้าไป intervene progression ของ cohort ในทางกลับกันอาจกล่าวได้ว่า RCT คือ specialized cohort study ซึ่งมีการ randomize and assign exposure ซึ่งมีข้อดีมากในการลด confounder ซึ่งจะกล่าวถึงต่อไป


การแบ่ง cohort เป็น Open cohort, closed cohort และ fixed cohort
tabwhite1. Open cohort หรือ dynamic cohort
tabwhiteสมาชิกใน cohortอาจมีการเข้า/ออกจาก cohort ได้ตลอดเวลา มีขนาดเปลี่ยนแปลงไปตามกาลเวลาแต่ละสมาชิกจะมีระยะเวลาการ follow up ไม่เท่ากัน ดังนั้น outcome ของการศึกษาจะรายงานเป็น incidence rate ต่อหน่วยเวลาเท่านั้น

cohort2
tabwhiteตัวอย่าง: การศึกษาโรคหัวใจในบุคลากรรพ.จุฬาลงกรณ์ที่มีภาวะอ้วนลงพุง ซึ่งมีการรับบุคลากรใหม่ตลอดเวลา และขณะเดียวกันก็มีคนที่เกษียณอายุ ลาออก ซึ่งถ้าไม่ได้ติดตามต่อก็จะไม่ทราบว่าเกิด outcome ขึ้นหรือไม่
tabwhiteตัวอย่างอื่นๆ ที่เป็น open cohort คือการศึกษาที่ขึ้นกับพื้นที่อยู่อาศัย, คนไข้ที่มา admit, registry โรคมะเร็ง เป็นต้น
tabwhite2. Closed cohort หรือ static cohort
tabwhiteทุกสมาชิกเริ่มเข้าใน cohortพร้อมๆกัน มี follow-up time เท่ากัน
ไม่มีการเปลี่ยนแปลง exposure status และไม่ควรมี loss to follow-up ดังนั้นเมื่อเวลาผ่านไป cohort จะมีขนาดเล็กลงเรื่อยๆ  การรายงาน outcome อาจเป็น cumulative incidence หรือ incidence rate ก็ได้ ถ้า closed cohort มี loss to follow-up อาจเรียกว่า fixed cohort ซึ่งจะรายงาน outcome ได้เป็น incidence rate เท่านั้น
tabwhite ตัวอย่าง: การศึกษาอัตราเสียชีวิตของผู้ประสบภัยสึนามิปี 2547 ที่มีและไม่มีภาวะ PTSD

cohort3


tabwhiteCohort analysis อาจแบ่งรูปแบบได้อีก 3 แบบใหญ่ๆ ตามช่วงเวลาที่ผู้ทำวิจัยเข้าไปเกี่ยวข้อง เป็นเกณฑ์

cohort4
tabwhite1. Prospective cohort (Concurrent cohort study)คือผู้วิจัยมีส่วนร่วมตั้งแต่จุดเริ่มต้นของการเก็บข้อมูล cohort และติดตามผลไปหาจุดสิ้นสุดในอนาคตพร้อมๆกัน
tabwhiteข้อดี: มีความน่าเชื่อถือสูงสุดในบรรดา cohort study มี information bias น้อยที่สุด
tabwhiteข้อเสีย: ต้องใช้เวลานาน และสิ้นเปลืองทรัพยากร การศึกษาบางอย่างผู้วิจัยอาจไม่สามารถรู้ผลได้ในช่วงอายุของตนเอง (เช่น birth asphyxia เพิ่มความเสี่ยงต่อ dementia หรือไม่)

cohort5
tabwhite2. 
Retrospective cohort (Historical cohort study) คือมีข้อมูลอยู่แล้ว ซึ่งข้อมูลนั้นอาจอยู่ในรูปของ cohort ที่มีการเก็บข้อมูลมาอย่างดี หรือเป็นการทบทวนข้อมูลเวชระเบียน ข้อมูลจากระบบคอมพิวเตอร์ก็ได้ โดย outcome ที่สนใจในข้อมูลนั้นเกิดขึ้นแล้ว แล้วผู้วิจัยย้อนไปวิเคราะห์ความสัมพันธ์ของ exposure ในอดีตก่อนหน้า มาถึง outcome ซึ่งเป็นอดีตที่ใกล้กว่า (ดูเทียบกับ nested case-control)
tabwhiteข้อดี: ทำได้รวดเร็ว สิ้นเปลืองน้อย study period อาจจบในเวลาไม่กี่เดือน
tabwhiteข้อเสีย: ความน่าเชื่อถือของข้อมูลต่ำ ข้อมูลมักจะไม่สมบูรณ์ ทั้งนี้ขึ้นกับแหล่งข้อมูลที่ทำการศึกษา เช่น ถ้าทำ retrospective โดยอาศัยข้อมูลจาก Framingham study ก็อาจจะน่าเชื่อถือกว่าการวิเคราะห์ตามรหัสการวินิจฉัยโรคในเวชระเบียน (ครั้งต่อไปที่สรุป chart ลองคิดถึงว่าอนาคตจะมีคนมาทำวิจัยนะครับ)

cohort6
tabwhite3. 
Combined cohort study คือมีข้อมูลของ exposure เกิดขึ้นแล้ว แต่ยังไม่เกิด outcome ผู้วิจัยใช้ข้อมูลเก่าเพื่อเข้าถึง กลุ่ม exposed และ non-exposed แล้วติดตามไปยัง outcome ที่จะเกิดในอนาคต

ย้ำข้อสังเกตอีกครั้ง* cohort study / analysis เรียกตามความสัมพันธ์ของ exposure กับ outcome แต่ที่มาของข้อมูลอาจไม่ได้เป็น well formed cohortจริงๆ ก็ได้ ความน่าเชื่อถือของ cohort study ส่วนหนึ่งจึงขึ้นกับความสมบูรณ์ของ ‘cohort’

tabwhiteนิยามของ period ต่างๆ ใน cohort study
tabwhite1. Study period & Follow-up period
tabwhiteStudy period คือช่วงเวลาที่ผู้ทำวิจัยเริ่มต้นศึกษาจนจบการศึกษา ส่วน Follow-up period คือช่วงเวลาที่สมาชิกเข้าใน cohort จนกระทั้งเกิด outcome หรือ loss to follow-up หรือ สิ้นสุดการศึกษา ดังนั้น ในprospective cohort study period จะเกิดขึ้นก่อนหรือพร้อมๆกับ follow up period, ใน restrospective cohort study period จะเกิดขึ้นหลัง follow up period, และใน mixed cohort follow up period จะเกิดขึ้นก่อน และคร่อมกับ study period

tabwhite2. Induction period & Latent period
tabwhiteInduction period หมายถึงระยะเวลาตั้งแต่มี exposure จนเกิดโรค กรณีตัวอย่างที่ induction periodนี้มีความสำคัญ เช่น อัตราการเกิด secondary malignancy ในผู้ที่ได้รับยาเคมีบำบัดบางชนิด ซึ่งเราต้องการทราบว่ายาเคมีบำบัดเป็นปัจจัยเสี่ยงของการเกิดมะเร็งซ้ำซ้อนหรือไม่ สมมติถ้าเราทราบคร่าวๆว่าการเกิดมะเร็งใหม่น่าจะมี induction period 5 ปี  ดังนั้นมะเร็งที่เกิดขึ้นหลังได้ยาเคมีบำบัดไม่นาน ก็น่าจะไม่ได้เป็นเหตุจากยาเคมีบำบัด (ผู้ป่วยอาจมีปัจจัยทางพันธุกรรมหรือความเสี่ยงอื่นๆอยู่แล้ว) วิธีการจัดการแบบหนึ่งคือการ exclude คนที่มี outcome เกิดขึ้นในช่วงที่คาบเกี่ยวกับ induction period ออกจากการศึกษา
tabwhiteLatent period คือเวลาตั้งแต่เกิดโรคจนถึงเวลาที่สามารถ detect ได้ ซึ่งจะแปรไปตามความไวของเครื่องมือที่เราใช้วัด outcome เช่น การ detect lung nodule ด้วย chest x-ray ย่อมมี latent period ยาวนานกว่า low-dose CT จึงเป็นประเด็นที่เราต้องสนใจในการแปลผลการศึกษาที่มีความถี่ในการตรวจติดตามต่างกันหรือใช้เครื่องมือต่างกัน
tabwhiteปัญหาในชีวิตจริงคือเราไม่สามารถทราบ induction และ latent period ที่ชัดเจน


tabwhiteConfounder in cohort study
tabwhiteConfounder หรือ confounding factor หรือตัวกวน มีความสำคัญมากใน observational study การที่ปัจจัยหนึ่งจะเป็น confounder ได้จะต้องมีคุณสมบัติดังนี้
tabwhite1. มีความสัมพันธ์กับ exposure status ซึ่งอาจกล่าวได้ว่า ‘เป็นปัจจัยที่มีการกระจายตัวในกลุ่ม exposure ที่ต้องการเปรียบเทียบไม่เท่ากัน’
tabwhite2. มีผลต่อ outcome
tabwhite3. ไม่ได้เป็น’ตัวกลาง’ระหว่าง exposure กับ outcome
cohort7.png
tabwhiteตัวอย่างของ confounder เช่น มีการศึกษาพบว่าคนที่ทาครีมกันแดดเป็นประจำจะมีมะเร็งผิวหนังบ่อยกว่าคนที่ไม่ทาครีม ซึ่งในการศึกษานี้ไม่ได้เก็บข้อมูลว่าทั้งสองกลุ่มมีอัตราการโดนแดดเป็นอย่างไร ดังนั้นกลุ่มที่ไม่ได้ทาครีมจริงๆแล้วก็เพราะอยู่แต่ในบ้าน ไม่ได้โดนรังสี UV ซึ่งเป็นปัจจัยเสี่ยงของมะเร็งผิวหนัง ในขณะที่ผู้ทาครีมเป็นประจำก็เพราะต้องโดนแดดบ่อยๆ การที่ไม่ตระหนักถึง confounder ก็จะทำให้สรุปผิดว่า การทาครีมกันแดดทำให้เสี่ยงต่อมะเร็งผิวหนัง
tabwhitePotential confounder คือกรณีที่ขาดคุณสมบัติข้อ 1 เช่น คนผิวขาวมีความเสี่ยงต่อมะเร็งผิวหนังสูงกว่าผิวสีอื่น สีผิวจึงสามารถกวนการศึกษาเรื่องนี้ได้ แต่ถ้าการศึกษานั้นทำในคนผิวขาวทั้งสิ้น สีผิวก็จะไม่ใช่ปัจจัยที่รบกวนผลการศึกษา
tabwhiteFactor in causal pathway คือกรณีที่ขาดคุณสมบัติข้อ 3 เช่น ถ้าเราศึกษาการโดนแดดกับความเสี่ยงมะเร็งผิวหนัง การใช้ครีมกันแดดแม้ว่าจะมีความสัมพันธ์กับการเกิดมะเร็งผิวหนังก็อาจไม่ใช่สาเหตุแต่เป็นเพียงผลจากการโดนแดดเท่านั้น อย่างไรก็ตามในชีวิตจริง ปัจจัยที่เป็นตัวกลางนี้มักจะไม่ได้มีความเป็นเหตุเป็นผลอย่าง ‘exclusive’ กับ exposure และ outcome เช่น ไม่ใช่ทุกคนที่โดนแดดจะทาครีม และบางคนที่ทาครีมก็ไม่ได้โดนแดด ดังนั้นในกรณีที่ไม่มั่นใจ เรามักจะถือว่าปัจจัยตัวกลางนี้เป็น confounder ไว้ก่อน

tabwhiteวิธีการจัดการกับ confounders
tabwhite Confounder ยังแบ่งเป็นกลุ่มที่เรารู้จักและไม่รู้จัก ซึ่งผลกระทบของ unknown confounder นั้นมีเพียงวิธีเดียวที่ช่วยกำจัดได้คือการ randomize ระหว่างกลุ่มเปรียบเทียบ ซึ่งจะทำให้ทั้ง known และ unknown confounder มีการกระจายในสองกลุ่มเท่าๆกัน ซึ่งการ randomize ทำได้ใน experimental study เท่านั้น  ดังนั้น confounder จึงเป็นสิ่งที่อยู่คู่กับ observational study เสมอ แทบเป็นไปไม่ได้ที่จะไม่มี confounder ดังนั้นเวลาอ่าน cohort study การมี confounder ในการศึกษาจึงไม่ใช่ข้อบกพร่อง เราควรให้ความสำคัญกับกระบวนการในการตรวจหา confounder, การแจกแจงการกระจายของ confounder ในสองกลุ่ม และวิธีการที่ใช้ในการลดผลของ confounder ต่อ outcome
tabwhite1. Design method
tabwhiteนอกจากการ randomize แล้ว ยังสามารถจัดการกับ confounder ได้โดย
tabwhite– Restriction คือการจำกัดกลุ่มการศึกษา อาจใช้ confounder ที่สำคัญเป็น exclusion criteria เช่น exclude คนที่เคยเป็น stroke, mi, pad ออกจากการศึกษาเรื่องเบาหวานกับความเสี่ยงโรคหัวใจ
tabwhite– Matching คือการพยายามให้กลุ่ม exposure และ control มีปัจจัยที่อาจเป็น confounder เท่าๆกัน เช่น เมื่อเรา include ผู้ชายอายุ 70 ปีที่เป็นเบาหวาน (exposure) เข้ามา เราก็จะพยายาม include คนไม่เป็นเบาหวาน (control) ที่เป็นเพศชายในกลุ่มอายุใกล้เคียงกันเข้ามาด้วย
tabwhiteทั้งสองวิธีนี้ข้อเสียคือทำให้ sample หาได้ยากขึ้น เพราะมีข้อจำกัด ความ genralizibility ลดลง เพราะไม่ใช่ normal population อีกต่อไป
tabwhite2. Statistical method
tabwhite– stratificationคือการทำ subgroup แบ่งตามสถานะของ confounder แล้วแยกวิเคราะห์ มีข้อจำกัดคือ
tabwhitetabwhite– ทำให้ sample size ในแต่ละกลุ่มย่อยลดลง
tabwhitetabwhite– ถ้า confounder เป็น continuous variable ก็อาจจะยังเหลือ residual confounder ได้ เช่น ทำ subgroup แยกคนอายุมากกว่า 60 ปี เพื่อลดปัจจัยของความชรา แต่ในกลุ่มที่อายุมากกว่า 60 ปีเอง ก็อาจพบว่ามีคนที่ชรามาก (อายุมากกว่า 80 ปี) กระจายตัวในกลุ่ม exposure และ control ไม่เท่ากันอยู่ดี
tabwhite– pooling คือการวิเคราะห์ outcome แยกตามกลุ่มย่อยแล้วนำมารวมกันด้วยวิธีทางสถิติ ที่นิยมคือ   Mantel Haenszel Weighted Averaging formula ซึ่งจะได้ผลลัพธ์เป็น weighted outcome และถ้านำมาเทียบกับ crude outcome ก่อนจะแบ่งกลุ่ม แล้วพบว่าค่าใกล้เคียงกันก็แปลว่าปัจจัยที่นำมาแบ่งกลุ่มนั้นไม่ได้เป็น confounder ถ้าค่าต่างกัน แสดงว่าปัจจัยนั้นๆมีผลต่อ outcome และเป็น confounder
tabwhiteตัวอย่างเช่น การศึกษาเทียบคนเป็น SLE กับ non-SLE พบว่าทั้งสองกลุ่มตายเท่าๆกัน (crude RR ~ 1.0) แต่เมื่อแบ่งกลุ่มตามเพศแล้วพบว่า ทั้งในเพศหญิงและเพศชายคนเป็น SLE จะตายมากกว่าคนที่ไม่เป็น เมื่อนำมา pool รวมกันก็พบว่า weighted RR ~ 3-4 เท่า เมื่อ crude และ weighted RR ต่างกันก็แปลว่า เพศ เป็น confounderที่เป็นเช่นนี้เพราะว่ากลุ่มคนที่ไม่เป็น SLE มีเพศชายมากกว่า ซึ่งผู้ชายในการศึกษานี้อาจจะมีโอกาสเสียชีวิตได้จากปัจจัยอื่นๆ ที่ไม่ใช่ SLE
tabwhiteอย่างไรก็ตามวิธีการ pooling จะเหมาะสมเมื่อ “ผลกระทบของ exposure ต่อ outcome ในแต่ละกลุ่มย่อยเป็นไปในทิศทางเดียวกัน” เช่น การศึกษาผลของ enalapril กับการเกิด ESRD โดยมีปัจจัยที่อาจเป็น confounder คือ GFR สมมติว่า crude RR พบว่า enalapril ไม่ช่วยลดหรือเพิ่ม ESRD เมื่อนำ GFR มาแบ่งกลุ่มอาจจะพบว่า กลุ่มที่ GFR > 30 enalapril มี benefit แต่กลุ่มที่ GFR < 30 enalapril กลับเพิ่ม progression เป็น ESRD  เมื่อนำสองกลุ่มมา pool กัน พบว่าได้ weighted RR ใกล้เคียงกับ crude RR ถ้าอาศัยหลักการ pooling ดังกล่าวข้างต้นจะสรุปว่า GFR status ไม่ใช่ confounder ทั้งที่จริงๆแล้วมีผล
tabwhite– Regression (Multivariable analysis)
tabwhiteข้อจำกัดของวิธีการทั้งหมดที่กล่าวมาข้างต้นคือ ไม่สามารถจัดการกับ confounder จำนวนมากได้ จึงต้องอาศัยวิธีการทางสถิติที่เรียกว่า multivariable analysis ซึ่งมีการคำนวณที่ซับซ้อน แต่ด้วยเทคโนโลยีคอมพิวเตอร์ทำให้การคำนวณนี้ทำได้ง่ายและแม่นยำ จึงทำให้เป็นวิธีจัดการกับ confounder ที่นิยมที่สุดในปัจจุบัน ในฐานะแพทย์เราอาจจะไม่ต้องเข้าใจการคำนวณโดยละเอียดแต่ควรรู้ถึงหลักการเบื้องต้นและข้อจำกัดต่างๆ พอเป็นสังเขป <multivariable analysis part 1>

ในปัจจุบันมีเทคนิคอีกหลายอย่างเข้ามาช่วยในการลด confounder เช่น การทำ propensity matching score ซึ่งผมเองยังไม่เข้าใจอย่างถ่องแท้ คงได้มีโอกาสมาคุยให้ฟังในโอกาสหน้า

ข้อควรระวัง* regression analysis รวมถึงวิธีการทางสถิติอื่นๆ เป็นการวิเคราะห์ด้วยตัวเลขเท่านั้น ไม่ได้คำนึงถึงความเป็นไปได้ในทาง physiology, ความถูกต้องและที่มาของข้อมูล


Key points in reading & appraising cohort study ‘on the fly’

  1. Research Question
    – clearly stated
    – relevant
    – biologic plausibility
    – any better previous study done?
  2. Cohort design
    – why use cohort study
    – why use this type of cohort study (prospective, retrospective)
    – is the cohort representative of interested population
    – appropriate sample size
    – common starting point in cohort
    – data complete & reliable
  3. Exposure
    – selection bias
    – what is the comparison: cohort VS normal population, cohort 1 VS cohort 2, or subgroup 1 VS subgroup 2 within same cohort
    – validity of exposure criteria: reliable, standard/optimal* criteria, completeness
  4. Confounder
    – all significant confounder listed and detected?*
    – how to handle confounder: exclusion, matched, subgroup, adjusted analysis
  5. Outcome
    – validity of outcome criteria and detection
    – study time long enough to capture outcome events
  6. Result
    – statistical techniques
    – clinical significance
    – statistical significant
    – how to handle confounder (same)
  7. Applicability
    – compare to our clinical setting
    – aware of limitation
  8. Suggestion for further & better study*

*optimal methods may not be the best, the gold standard of measurements, but best suit the design, setting, availability, budget, time, personnel of the study

Summary

  • Understand Cohort VS Cohort study
  • Choose cohort study when
    • exposure is known, may be rare but detectable
    • outcome is frequent in exposed group
    • exposed-outcome duration relatively short VS budget & time available
  • Aware of: selection bias, measurement bias, loss-to-follow up bias
Advertisements