Información

Sesgo de datos en los datos de interacciones proteína-proteína

Sesgo de datos en los datos de interacciones proteína-proteína


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Bases de datos como STRING tienen tantos datos de interacciones experimentales y predichas para muchos organismos ¿Sin embargo, hay un sesgo en los datos que tienen ?.

a) La primera es la co-ocurrencia de genes, que se parece más a un argumento circular.

b) Y el segundo es que todas las interacciones que se predicen computacionalmente se prueban para interacciones experimentales, lo que conduce a un sesgo en los datos de interacción disponibles para los organismos en STRING.

¿Cómo superamos este sesgo de datos al utilizar los datos de interacción de STRING con fines de análisis?

a) Evitar los canales de evidencia de co-ocurrencia de genes es una forma, ¿hay alguna otra forma que no sea esta?

b) ¿Cómo decir estadísticamente que el sesgo no gobierna los datos o alguna forma de probar la significación estadística del sesgo de los datos?


Soy uno de los mantenedores de STRING, así que espero poder aclarar un poco las cosas.

Co-ocurrencia de genes: Los métodos de contexto genómico son muy útiles para los genomas bacterianos, pero no tanto para los eucariotas. Sin embargo, en realidad son los datos más imparciales que tenemos, ya que no hay influencia humana (más allá de seleccionar especies para secuenciar).

Evaluación comparativa: Las interacciones predichas a partir de la minería de texto, etc. se comparan con la base de datos KEGG. Sin embargo, esto no conduce necesariamente a sesgos, ya que esta evaluación comparativa es básicamente un paso de calibración.

Sesgos reales: Para los eucariotas, la mayoría de los datos de interacción provienen del canal experimental, de base de datos y de minería de texto. Todos estos están sesgados de varias maneras: p. Ej. hay sesgos de estudio (los genes de enfermedades recibirán más atención) y sesgos técnicos (es difícil trabajar con algunas proteínas)

Como no conocemos el conjunto real de interacciones proteína-proteína, probablemente no podamos probar los sesgos en los datos.


Ver el vídeo: SESGO Y CURTOSIS (Julio 2022).


Comentarios:

  1. Okpara

    Creo que están equivocados. Propongo discutirlo. Escríbeme en PM, habla.

  2. Beaman

    ¡¡¡¡Hurra!!!! El nuestro ha expirado :)

  3. Holman

    Pido disculpas, pero ¿podrías describir con un poco más de detalle?

  4. Kigakazahn

    el mensaje muy valioso

  5. Iustig

    Están equivocados. Tenemos que hablar. Escríbeme en PM.

  6. Tabar

    Que buena idea

  7. Banain

    Entre nosotros digamos, intente buscar la respuesta a su pregunta en google.com



Escribe un mensaje