Content area
Full Text
AIDS Behav (2012) 16:797806 DOI 10.1007/s10461-012-0147-8
ORIGINAL PAPER
Estimating Design Effect and Calculating Sample Size for Respondent-Driven Sampling Studies of Injection Drug Users in the United States
Cyprian Wejnert Huong Pham Nevin Krishna
Binh Le Elizabeth DiNenno
Published online: 15 February 2012 Springer Science+Business Media, LLC (outside the USA) 2012
Abstract Respondent-driven sampling (RDS) has become increasingly popular for sampling hidden populations, including injecting drug users (IDU). However, RDS data are unique and require specialized analysis techniques, many of which remain underdeveloped. RDS sample size estimation requires knowing design effect (DE), which can only be calculated post hoc. Few studies have analyzed RDS DE using real world empirical data. We analyze estimated DE from 43 samples of IDU collected using a standardized protocol. We nd the previous recommendation that sample size be at least doubled, consistent with DE = 2, underestimates true DE and recommend researchers use DE = 4 as an alternate estimate when calculating sample size. A formula for calculating sample size for RDS studies among IDU is presented. Researchers faced with limited resources may wish to accept slightly higher standard errors to keep sample size requirements low. Our results highlight dangers of ignoring sampling design in analysis.
Keywords Respondent-driven sampling Design effect
Sample size Injecting drug users HIV Hidden
populations
Resumen El muestreo dirigido por los participantes (RDS, por sus siglas en ingls) es cada vez ms utilizado para tomar muestras de poblaciones ocultas, como las de usuarios de drogas inyectables (UDI). Sin embargo, los datos del RDS son muy particulares y requieren de tcnicas de anlisis especializado, muchas de las cuales no se han desarrollado. Para estimar el tamao de la muestra del RDS es necesario conocer los efectos del diseo (DE, por sus siglas en ingls), los cuales solo pueden ser calculados en forma posterior. Pocos estudios han analizado el DE del RDS utilizando datos empricos reales. Nosotros analizamos el DE de 43 muestras de UDI recolectadas a travs de un protocolo estandarizado. Determinamos que la recomendacin anterior de que por lo menos se duplique el tamao de la muestra, congruente con DE = 2, subestima DE verdaderos, por lo que recomendamos a los investigadores utilizar DE = 4 como una estimacin alternativa para calcular el tamao de la muestra....