Índex 1. Introducció ..................................................................................................................... 2 2. Bioinformàtica ................................................................................................................ 3 2.1.Principals àrees d’investigació .................................................................................... 3 2.2.Història de la bioinformàtica ........................................................................................ 9 3. Software disponibles....................................................................................................11 4. Guia ràpida del BLAST................................................................................................12 5. Aplicació del BLAST: estudi dels genomes de les varietats de mandarina............16 5.1. Introducció a la mandarina........................................................................................16 5.2. Gens de la Citrus reticulata.......................................................................................18 5.3. Comparació amb els gens d’interés..........................................................................23 5.4. Quadre resum dels enzims.......................................................................................53 6. Conclusions..................................................................................................................55 7. Glossari..........................................................................................................................58 8. Agraïments....................................................................................................................61 9. Webgrafia.......................................................................................................................61 10. Annexos.......................................................................................................................64
1
1. Introducció El tema era del nostre interès perquè així podíem entendre com i per què és fan els aliments transgènics i, a més, pensem que en un futur quasi tot tindrà a veure en la bioinformàtica per a fer prototips i després, d’aquests resultats fer una aplicació a la vida real. També ens va influenciar en la tria del treball els nostres pares, que tenen cultius de mandarines, ja que Alcanar n’hi ha molts. Des de ben petites que sempre ens han portat a veure les finques, ensenyant-nos tot sobre elles i tot el que se‘ls hi fa al llarg de l’any per a despès treure-li benefici, el qual fan amb totes les seves ganes i és una de les coses que els ho agrada més. Llavors ens vam platejar que amb aquest treball podríem ensenyar nosaltres als nostres pares una tècnica que en un futur podrien afavorir-los de moltes formes, per aconseguir el millor producte. Vam decidir dividir el nostre treball en dues parts: A la primera part realitzàrem una recerca sobre la teoria i informació necessària per a començar a saber el que havíem de fer i iniciar-nos a la bioinformàtica, un concepte totalment nou per a nosaltres pel que fa a la pràctica i que només l’havíem sentit per damunt en algun context científic. També havíem de cercar informació sobre la mandarina per saber el seu nom científic (Citrus Reticulata) i les característiques i varietats que hi ha. Després de cercar el necessari portàrem a cap el nostre objectiu, el qual és: a partir de la bioinformàtica i de l’aplicació BLAST, un programa informàtic especialitzat en aquest camp, trobar la mandarina perfecta sabent els gens que donen les característiques òptimes. Una vegada centrat el nostre objectiu, vam començar a realitzar la nostra segona part del treball. Aquesta és només la pràctica i gairebé és tot el treball. Per començar havíem d’aprendre a utilitzar el BLAST mitjançant guies amb vídeos, les instruccions del programa i “jugant” amb ell per acabar de polir la tècnica. Una dificultat que se’ns presentà és l’anglès, ja que tot està amb aquest idioma. Quan vam saber utilitzar-lo, ens posàrem a la recerca dels enzims de la Citrus Reticulata amb un altre programa anomenat Genome databank, on hi ha codificats algunes proteïnes que la formen. Com no hi ha més fonts d’informació i codificació d’enzims només podem treballar amb aquest programa, per tant, els enzims obtinguts són només del Genome databank. Després de cercar totes les proteïnes, vam buscar la funció de cadascuna i a partir d’aquí realitzàrem una selecció dels enzims d’interès. Per últim, passàrem de proteïnes a gens, els vam comparar amb el Blast i vam treure les nostres conclusions. 2
2. Bioinformàtica És una àrea emergent interdisciplinària
que s’ocupa de l’aplicació de tecnologia
computacional a la gestió, anàlisis, emmagatzematge, organització, manipulació, presentació i distribució de informació relativa a les dades biològiques o mèdiques, com per exemple les macromolècules (DNA i proteïnes d’entre altres).
Aquesta disciplina té 3 objectius clars: 1. Organitzar les dades a una base de dades: La bioinformàtica organitza les dades permetent als investigadors un accés a la informació ja existent i poder publicar noves dades a mesura que aquestes vagin apareixent. Cal destacar que la informació emmagatzemada en aquestes bases és inservible fins que no s’analitza, per tant, l’anàlisi de dades és una feina essencial realitzada per la bioinformàtica. 2. Desenvolupament d’eines i recursos per facilitar l’anàlisi de dades: Un exemple d’aquests recursos és el programa BLAST (Basic Local Alignment Search Tool) que permet comparar diferents seqüències d’ADN amb altres ja existents i registrades.
3. Utilitzar aquestes eines per analitzar i interpretar els resultats de les dades: Anteriorment els estudis biològics es concentraven en els detalls dels sistemes, però en l’actualitat es poden realitzar anàlisis globals amb totes les dades disponibles, el qual permet descobrir principis comuns i noves característiques dels sistemes biològics.
2.1. PRINCIPALS ÀREES D’INVESTIGACIÓ Anàlisis de seqüències:
Des que el fag Φ-X174 va ser seqüenciat al 1977,
les
seqüències d'ADN de centenars d'organismes han estat descodificades i desades en bases de dades. Aquestes dades són analitzades per determinar els gens que codifiquen per a certes proteïnes, així com també seqüències reguladores. Una comparació de gens en una espècie o entre espècies pot mostrar similituds entre funcions de proteïnes, o relacions entre espècies.
3
Per la creixent quantitat de dades, des de fa molt s'ha tornat poc pràctic analitzar seqüències d'ADN manualment, en conseqüència es fan servir programes d' ordinador per estudiar el genoma de milers de organismes, contenint milers de milions de nucleòtids. Aquests programes poden compensar mutacions (amb bases intercanviades, esborrades o inserides) en la seqüència d'ADN, per identificar seqüències que estan relacionades, però que no són idèntiques. Una variant d'aquest alineament de seqüències s'usa en el procés de seqüenciació .
Un altre aspecte de la bioinformàtica en anàlisi de seqüències és la recerca automàtica de gens i seqüències reguladores dins d'un genoma. No tots els nucleòtids dins d'un genoma són gens. Dins del genoma d'organismes més avançats, grans parts de l'ADN no serveixen a cap propòsit. Aquest ADN, conegut com "ADN escombraries", pot, però, contenir elements funcionals encara no reconeguts. La bioinformàtica serveix per estrènyer la bretxa entre els projectes de genoma i proteoma (per exemple, en l'ús de seqüències d'ADN per a identificació de proteïnes).
Anotació de genomes:
En el context de la genòmica,
anotació és el procés de marcat dels gens i altres característiques biològiques de la seqüència d'ADN. El primer programari sistem d'anotació de genomes va ser dissenyat el 1995 per Owen White, qui va ser membre de l'equip que va seqüenciar i analitzar el primer genoma en ser descodificat
d'un
organisme
independent,
el
bacteri
Haemophilus influenzae. White va construir un programari per localitzar els gens (llocs en la seqüència de DNA que codifiquen una proteïna), el ARN de transferència, i altres característiques, així com per a realitzar les primeres atribucions de funció a aquests gens. La majoria dels actuals sistemes d'anotació genòmica treballen de manera similar, però els programes disponibles per a l'anàlisi del genoma es troben en continu canvi i millora.
Biologia evolutiva computacional: La Biologia evolutiva és l'estudi de l'origen ancestral de les espècies, així com del seu canvi a través del temps. La informàtica ha donat suport als biòlegs evolutius en diferents camps clau. Ha permès als investigadors:
4
●
Seguir la evolució d'un alt nombre d'organismes mesurant canvis en el seu ADN, en lloc de fer-ho exclusivament mitjançant la seva taxonomia física o observacions fisiològiques .
●
Més recentment, comparar genomes complets, el que permet l'estudi d'esdeveniments evolutius més complexos, com ara la duplicació de gens, la transferència horitzontal de gens, o la predicció de factors significatius en la especiació bacteriana.
●
Construir models computacionals complexos de poblacions per predir el resultat del sistema a través del temps.
●
Seguir i compartir informació sobre un ampli i creixent nombre d'espècies i organismes.
Mesura de la biodiversitat: Es fa ús d’un programari especialitzat per trobar, visualitzar i analitzar la informació; i, el que és més important, per compartir-la amb altres interessats. La simulació computacional pot modelar coses com ara dinàmica poblacional, o calcular la millora del patrimoni genètic d'una varietat (en agricultura), o la població amenaçada (en biologia de la conservació). Un potencial molt gran en aquest camp és la possibilitat de preservar les seqüències completes del ADN, o genomes, d'espècies amenaçades de extinció,
el qual permetent registrar els resultats de l'experimentació genètica de la
Naturalesa via computacional per a la seva possible reutilització futura, encara si aquestes espècies fossin finalment perdudes.
Anàlisis de l’expressió gènica: La expressió gènica de molts gens pot determinar-se per al mesurament de nivells de mRNA mitjançant múltiples tècniques, incloent microarrays d'ADN, seqüenciació de EST (Expressed Sequence Tag), anàlisi en sèrie de l'expressió gènica (Serial Analysis of Gene Expression - SAGE), MPSS (Massively Parallel Signature Sequencing), o diverses aplicacions de hibridació in situ. Aquests estudis s'usen sovint per determinar els gens implicats en un desordre: podrien, per exemple, comparar dades de microarrays de cèl·lules epitelials canceroses amb dades de cèl·lules no canceroses per determinar les transcripcions que són activades o reprimides en una població particular de cèl·lules canceroses.
5
Anàlisis de la regulació: S'han aplicat tècniques bioinformàtiques per explorar diversos passos en aquest procés. Per exemple, l'anàlisi del promotor d'un gen implica la identificació i estudi de les seqüències motiu en els voltants de l'ADN de la regió codificant d'un gen. Aquests motius influeixen en l'abast segons el qual aquesta regió es transcriu a ARNm. Les dades d'expressió poden usar-se per inferir la regulació gènica: podrien comparar dades de microarrays provinents d'una àmplia varietat d'estats d'un organisme per a formular hipòtesis sobre els gens involucrats en cada estat.
Anàlisis de l’expressió de proteïnes: Els microarrays de proteïnes i la espectrometria de masses d'alt rendiment poden proporcionar una instantània de les proteïnes presents en una mostra biològica. La bioinformàtica està molt compromesa en donar suport a tots dos procediments.
Anàlisis de mutacions en el càncer: Es realitzen esforços massius de seqüenciació per identificar substitucions individuals de bases (o punts de mutació de nucleòtids) encara desconeguts en una varietat de gens en el càncer. Els bioinformàtics continuen produint sistemes automatitzats per gestionar l'important volum de dades de seqüències obtingut, i creen nous algoritmes i programari per comparar els resultats de seqüenciació amb la creixent col·lecció de seqüències del genoma humà i dels polimorfismes de la línia germinal.
Predicció de l’estructura de les proteïnes: La seqüència d’aminoàcids d’una proteïna, també anomenada estructura primària, pot ser determinada fàcilment des de la seqüència de nucleòtids del gen que la codifica. En la majoria dels casos, aquesta estructura determina únicament una estructura de la proteïna en el seu ambient natiu. El coneixement d’aquesta estructura es vital per a entendre la funció de la proteïna. La informació estructural de les proteïnes es classifica usualment com estructura secundaria, terciària i quaternària. Una solució general viable per a la predicció d’aquestes estructures encara està com un problema obert. Una de les idees clau de la bioinformàtica és la noció de homologia. En la branca genòmica de la bioinformàtica s’usa l’homologia per a predir la funció d’un gen: si la seqüència del gen A, el qual sabem la funció, és homòloga a la del gen B, el qual no sabem la funció, pot inferir-se que B podria compartir la funció d'A. En la branca 6
estructural de la bioinformàtica, la homologia s'usa per determinar quines parts d'una proteïna són importants en la formació de l'estructura i en la interacció amb altres proteïnes. En la tècnica denominada modelatge per homologia, aquesta informació es fa servir per predir l'estructura d'una proteïna un cop coneguda l'estructura d'una proteïna homòloga. Esta és, actualment, l'única via per predir estructures de proteïnes d'una manera fiable.
Genòmica comparativa: El nucli de l'anàlisi comparativa del genoma és l'establiment de la correspondència entre gens (anàlisi ortòleg) o entre altres característiques genòmiques de diferents organismes. Aquests mapes intergenómics són els que fan possible rastrejar els processos evolutius responsables de la divergència entre dos genomes. Una multitud d'esdeveniments evolutius actuant a diferents nivells organitzatius conformen l'evolució del genoma. Al nivell més baix, les mutacions puntuals afecten nucleòtids individuals. Al major nivell, amplis segments cromosòmics experimenten duplicació, transferència horitzontal, inversió, transposició, esborrat i inserció. Finalment, els genomes sencers estan involucrats en processos d'hibridació, poliploïdia i endosimbiosis, conduint sovint a una sobtada especiació.
La complexitat de l'evolució del genoma planteja molts reptes excitants a desenvolupadors de models matemàtics i algorismes, els qui han de recórrer a un espectre de tècniques algorítmiques, estadístiques i matemàtiques que s'estenen des exactes, heurístiques, amb paràmetres fixats, i mitjançant algoritmes d'aproximació per problemes basats en models de parsimònia, fins algoritmes "Markov Chain Monte Carlo" per a anàlisi bayesià de problemes basats en models probabilístics. Molts d'aquests estudis estan basats en la detecció d'homologia i la computació de famílies de proteïnes.
7
Modelat de sistemes biològics: La biologia de sistemes implica l'ús de simulacions per ordinador de subsistemes cel·lulars, tant per analitzar com per a visualitzar les complexes connexions d'aquests processos cel·lulars. La vida artificial o l'evolució virtual tracten d'entendre els processos evolutius per mitjà de la simulació per ordinador de senzilles formes de vida (artificial).
Anàlisi d’imatge d’alt rendiment: S'estan fent servir tecnologies de computació per accelerar o automatitzar completament el processament, quantificació i anàlisi de grans quantitats d'imatges biomèdiques amb alt contingut en informació. Els moderns sistemes d'anàlisi d'imatge incrementen l'habilitat de l'observador per a realitzar anàlisi sobre un ampli o complex conjunt d'imatges, millorant la precisió, l'objectivitat (independència dels resultats segons l'observador), o la rapidesa. Un sistema d'anàlisi totalment desenvolupat podria reemplaçar completament a l'observador. Tot i que aquests sistemes no són exclusius del camp de les imatges biomèdiques, cada vegada són més importants tant per al diagnòstic com per a la investigació.
Acoblament proteïna- proteïna: En les últimes dues dècades, desenes de milers d'estructures tridimensionals de proteïnes han estat determinades per cristal·lografia de raigs X i espectroscòpia mitjançant ressonància magnètica nuclear de proteïnes (RMN de proteïnes). Una qüestió central per als científics és si resulta viable la predicció de possibles interaccions proteïna-proteïna solament basats en aquestes formes 3D, sense realitzar experiments identificatius d'aquestes interaccions. S'han desenvolupat una varietat de mètodes per enfrontar-se al problema de l'acoblament proteïna-proteïna, tot i que sembla que queda encara molta feina en aquest camp.
8
2.2. HISTÒRIA DE LA BIOINFORMÀTICA La seva història comença en la dècada dels 50 del passat segle XX, anys on els científics Watsos i Crick proposen l’estructura de la doble hèlix de l’ADN (1953), es seqüència la primera proteïna (insulina bovina) per F.Sanger (1995) i es construeix el primer circuit integrat (també conegut com xip o microxip) per Jack Kilby als laboratoris de Texas Instruments. Anys 60 y 70 del segle XX: En els anys, L.Pauling va elaborar la seva teoria sobre la evolució molecular i Margaret Dayhoff, una de les pioneres de la bioinformàtica, va publicar el primer dels atlas of protein sequences (1965), que tindrà continuïtat ens anys posteriors i serà precursors de les actuals bases de dades de proteïnes. En l’àrea de la tecnologia de computadors, es presenten en el ARPA (Advanced Research Projects Agency), els protocols de commutació de paquets de dades sobre xarxes d’ordinadors (1968), que permetran enllaçar poc després diversos ordinadors de diferents universitats als EE.UU. El 1969 va néixer ARPANET embrió del que posteriorment serà Internet. En 1970 es publica el algoritme Needleman-Wunsch per alineament de seqüències ; s'estableix el Brookhaven Protein Data Bank (1971), es crea la primera molècula d' ADN recombinant (Paul Berg, 1972), EM Southern desenvolupa la tècnica Southern blot de localització de seqüències específiques d'ADN (1976), comença la seqüenciació d'ADN i el desenvolupament de programari per a analitzar-lo (F. Sanger, programari de R. Staden, 1977), i es publica en 1978 la primera seqüència de gens completa d'un organisme, el fago Φ -X174 (5.386 parells de bases que codifiquen 9 proteïnes). Anys 80 del segle XX: ● Pel que fa al desenvolupament d'algoritmes, mètodes i programes, apareix el algoritme Smith-Waterman (1981), l'algoritme de cerca a bases de dades de seqüències (Wilbur-Lipman, 1983), FASTP/FASTN (recerca ràpida de similituds entre seqüències, 1985), l'algoritme FASTA per comparació de seqüències (Pearson i Lipman, 1988), i comencen a utilitzar-se models ocults de Markov per analitzar patrons i composició de les seqüències (Churchill, 1989), la qual cosa permetrà més endavant localitzar gens i predir estructures proteiques; apareixen importants bases de dades biològiques (GenBank en 1982 , Swiss-Prot en 1986), també en aquests anys comença a estudiar-se la viabilitat de la Human Genome Initiative (First Santa Fe Conference, 1985), que serà anunciada un any després 9
pel DoE (Department of Energy) i que posarà en marxa projectes pilot per desenvolupar recursos i tecnologies crítiques; en 1987 el NIH (National Institutes of Health, instituts nacionals de la salut dels EUA) comença aportar fons a projectes genoma, mentre que a 1988 arrenca la Human Genome Initiative, més coneguda finalment com Human Genome Project (Projecte Genoma Humà). Anys 90 XX: ● Recerca ràpida de similituds entre seqüències amb BLAST (1990); base de dades de petjades de proteïnes PRINTS, de Attwood i Beck (1994); ClustalW, orientat al alineament múltiple de seqüències, a 1994, i PSI-BLAST en 1997; a la fi de la dècada es desenvolupa T-Coffee, que es publica en 2000. Pel que fa a activitats institucionals i nous organismes, es creen el Sanger Centre (Hinxton, UK, 1993 ; ara Sanger Institute) i el European Bioinformatics Institute (EBI, Hinxton, UK, 1992 1995). Primers anys del segle XXI: ● Al 2001apareix publicat el genoma humà (3 Gbp). Poc després, en 2003, i amb dos anys d'avançament sobre el previst, es completa el Human Genome Project. Per esmentar alguns dels genomes analitzats en els anys següents, anotarem que al 2004 apareix l'esborrany del genoma de rata comuna (rata), al 2005 el del ximpanzé, en 2006 el del macaco rhesus, al 2007 el del gat domèstic, i al 2008 es seqüència per primera vegada el genoma d'una dona. Gràcies al desenvolupament de les tècniques adequades, assistim actualment a un allau de seqüenciacions de genomes de tot tipus d'organismes. ● Al 2003 es funda a Espanya el Institut Nacional de Bioinformàtica i al 2008 UniProt presenta el primer esborrany del proteoma complet del ésser humà, amb més de vint mil entrades.
10
3. Software disponibles Les eines de programari per bioinformàtica van des de simples eines de línia de comandaments fins molt més complexos programes gràfics i serveis web autònoms situats en companyies de bioinformàtica o institucions públiques. Com per exemple: ●
Serveis d'obtenció d'informació en línia (consultes a bases de dades, per exemple).
●
Eines d'anàlisi (per exemple, serveis que donen accés a EMBOSS).
●
Recerques de similituds entre seqüències (serveis d'accés a FASTA o BLAST).
●
Alineaments múltiples de seqüències (accés a ClustalW o T-Coffee).
●
Anàlisi estructural (accés a serveis de alineament estructural de proteïnes, per exemple).
●
Serveis d'accés a literatura especialitzada i ontologies.
Hem escollit el software anomenat BLAST, perquè és del més coneguts juntament amb el ClustaIW, el qual és un algoritme per determinar la similitud de seqüències arbitràries amb altres seqüències, probablement residents en bases de dades de proteïnes o de seqüències d'ADN. en el nostre cas per determinar la similitud de seqüències de les diferents varietats de mandarines.
11
4. Guia ràpida del BLAST El BLAST (basical local alignment search tool) és un programa informàtic d’alineament de seqüències de nucleòtids. La seva funció principal és comparar una seqüència a elegir, per unes altres que estiguin a una base de dades i que tinguin semblança amb la original. D’aquesta manera, en el nostre cas, podem saber quines mandarines tenen més semblances entre elles i quines són més diferents, així com podem trobar diferents gens específics d’algunes mandarines. La funció del BLAST està dissenyada per un algorisme heurístic, el que significa que no totes les respostes són certes, no obstant, el programa és capaç de calcular el grau de significança dels seus resultats, pel que proveeix d’un paràmetre per a jutjar el resultats que s’obtenen. Una vegada vist què és el BLAST, la seva funció i com actua, anem a veure com s’utilitza:
1. Entrem a la pàgina web del NCBI (National Center for Biotechnology Information) i a la dreta, a un apartat anomenat Popular Resources, estaran els programes disponibles incloent el BLAST.
2. Una vegada entrem al BLAST ens trobem amb 4 opcions, de les quals només ens interessa la NUCLEOTIDE BLAST. Treballarem amb el format de la web ja que no es pot descarregar fàcilment
12
3. Observem diferents apartats i opcions: ENTER QUERY SEQUENCE
Aquest apartat serveix per posar la nostre seqüència d’ADN, si l’has trobat a una base de dades, copies i pegues a l’espai en blanc, si la tens guardada adjuntes un fitxer. Pots alinear dos o més de dos seqüències prement l’ultima pestanya de l’apartat i posant-les a l’espai en blanc. També pots indicar d’on i fins on vols l’alineament. Finalment, a dalt de tot, es poden observar cinc opcions de BLAST (blastn, blastp, blastx, tblastn i tblastx), cadascuna té una funció diferent, nosaltres utilitzarem el blastn que serveix per alinear nucleòtids que és el que ens interessa. Les opcions aquestes coincideixen amb les opcions de la pàgina principal del BLAST.
CHOOSE SEARCH SET En el segon apartat podem observar, d’entrada, l’opció database, on hem d’indicar on ha de buscar el programa les similituds de les bases de la nostra seqüència, en el nostre cas a la col·lecció de nucleòtids. La resta de funcions són opcionals, serveixen per excloure alguns models, per donar lloc al organisme de la seqüència i per limitar la recerca d’alguns materials/organismes concrets.
13
PROGRAM SELECTION Simplement hem de triar l’algorisme que volem utilitzar, normalment s’utilitza el primer ja que és el més òptim, però tot depèn del que vulguis fer. Una vegada ja esta tot complert, només cal clicar damunt de BLAST i el programa et dona les semblances amb els diferents organismes, el percentatge i de quin gen es pot tractar. Podem triar que els resultats es donin en una pàgina a part i no en la mateixa on estem utilitzant en BLAST.
RESULTATS: En primer lloc ens apareix un requadre que és un petit resum dels nucleòtids alineats en els diferents gens comparats.
14
En segon lloc trobem els diferents gens de les diferents espècies i el seu percentatge de similitud amb la seqüència utilitzada.
Finalment, el programa ens ensenya les variacions entre els diferents gens trobats i la nostra seqüència, és a dir, de cada gen trobat ens analitza quines bases són diferents a la nostra seqüència. D’aquesta manera, podem saber, en mandarines, que diferència els diferents tipus.
15
5. Aplicació amb Blast: estudi dels genomes de les varietats de mandarina
5.1 INTRODUCCIÓ A LA MANDARINA La mandarina és el fruit de les diferents espècies de cítrics anomenats de forma comuna mandariner. El tipus comú quan parlem de mandarina, ens estem referint al que científicament s’anomena Citrus reticulata. El fruit prové de les zones tropicals d’Àsia i es creu que el seu nom ve donat pel color dels uniformes que utilitzaven els governadors de l’antiga Xina. Va ser introduït a Europa al segle XIX. Actualment, els principals països productors de mandarines són: Xina, Espanya, Brasil, Argèlia, Argentina, Colòmbia, Marroc, Israel, Japó, Uruguai, Mèxic, Paraguai, Perú, Bolívia i Equador. TIPUS: Hi ha moltes varietats de mandarines procedents de mutacions d’aquest fruit, per mutacions espontànies o pel creuament amb altres cítrics. Per això és classifiquen en 3 grans grups: ➔ El primer gran grup és el grup de les CLEMENTINES (Citrus reticulata): CARACTERÍSTIQUES: 1. Provenen del mandariner comú. 2. Comercialment, la seva mida és entre petit i mitja. 3. Tenen alternança en la producció, és a dir, uns anys es produeix molt però el fruit és petit i els altres anys no es produeix tant però el fruit es més gran. VARIETATS D’AQUEST GRUP: ● Clementina fina: Pell fina, es recull entre novembre i gener. Freqüentment ha de ser tractada per la seva mida i el seu quallat, molt dolça i amb molt de suc. ● Oroval: Fruit de forma arrodonit i més gran que l’anterior, pell granulosa, es recull entre novembre i desembre. No es convenient per a la seva conservació, deixar el fruit a l’arbre ja que perd suc, prové d’una mutació genètica de la Fina. ● Marisol: Igual que l’Oroval, ja que prové d’una mutació genètica d’aquesta, però es recull 15 o 20 dies abans. 16
● Clemenules: Prové d’una mutació de la Fina, fruit gran, aplanada polpa amb molt de suc i molt bona qualitat. Es recull de novembre a gener i es manté sense cap problema a l’arbre. ● Oronules: Fruit de mida mitjà amb una forma lleugerament aplanada polpa de bona qualitat i sense llavors. Madura abans que les altres i es recull a mitjans d’octubre. ● Clemenpons: Mutació genètica de les Clemenules, igual que aquesta però la seva maduració s’avança 15 dies. ● Esbal: Mutació genètica de la varietat Fina, fruit de mida mitjana i amb una forma aplanada. Maduració igual que l’Oroval. Les pluges prolongades poden afectar al fruit una vegada madur. ● Loretina: Prové d’una mutació genètica de la Marisol, pell rugosa i fàcil de pelar. Es recull uns dies abans que la Marisol. ● Hernandina: Prové d’una mutació de la varietat Fina, el fruit és molt paregut a la Fina però sense llavors, excepte si hi ha pol·linització. Aguanta be les pluges. En aquesta varietat el desenvolupament del color no es produeix totalment, quedant la zona d’unió amb la rama d’un color lleugerament verdós.
➔ El segon gran grup és el grup de les SATSUMA: CARACTERÍSTIQUES: 1. S’utilitzen a nivell industrial per a la fabricació de conservació de galls en almívar o en suc natural. 2. Són les més resistents al fred. 3. Són les primeres en madurar. 4. Una vegada han arribat a la maduració, perden ràpidament el contingut en àcids del fruit. VARIETATS D’AQUEST TIPUS: ● Okitsu Wase: Molt bona qualitat gustativa, és la que madura primer i es recull a Setembre. ● Owari: Fruit mitja o petit, amb molt de gust i amb forma aplanada. De vegades, la zona d’unió amb la rama té una forma aperada. ● Clausellina: Fruit de baixa qualitat perquè no és dolça. Té una mida superior a la varietat Owari.
17
➔ L’últim grup és el grup dels HÍBRIDS: Són híbrids de Citrus x tangerina i Citrus reticulata amb altres espècies del gènere Citrus i els seus fruits també reben el nom de mandarines. Aquests híbrids solen produir fruits de bona mida i color taronja vermellós molt atractiu. La polpa posseeix gran quantitat de suc i és abundant en sucres i àcids orgànics. La pell està molt adherida a la polpa. Solen ser d’origen Mediterrani i pràcticament es troben en camps d’explotació familiar. Tenen moltes llavors i una escassa conservació, és per això que en el comerç mundial no tenen molta importància.
5.2. GENS DE LA CITRUS RETICULATA Després de realitzar una investigació amb la Genome NCBI de la mandarina, hem trobat una sèrie de gens que intervenen en diferents rutes metabòliques i en diferents reaccions. A continuació adjuntarem els enzims provinents dels gens amb una petita explicació: 1. Acyl-CoA thioesterase: Acyl-CoA tioesterasa (Acot2) localitza a la matriu mitocondrial i hidrolitza l'acil-CoA greix de cadena llarga en FA i CoASH lliure. Acot2 s'expressa en teixits altament oxidatius i està preparada per modular l'oxidació FA mitocondrial (FAO), però el seu paper biològic és desconegut.
2. Glutathione peroxidase, partial: Glutatión peroxidases són una família d'enzims clau que intervenen en la detecció d'oxiradicals en animals. Recentment, es va informar sobre l'existència d'aquest enzim a les plantes. Els gens amb homologia de seqüència significativa a un membre de la família GPX animal, és a dir, hidroperòxid fosfolípid glutatión peroxidasa (PHGPX), es va aïllar de diverses plantes. 3. Phenylalanine ammonia-lyase: Aquesta subpartida és part de la via de la biosíntesi trans-cinnamat, que en si forma part del metabolisme del fenilpropanoide.
4. Chalcone synthase: Produeix chalcona que és una cetona aromàtica i una enona que forma el nucli central per a una varietat de compostos biològics importants que es coneixen de forma col·lectiva com chalconeoides. 5. R2R3-MYB transcription factor 68, partial: S’ha aïllat i caracteritzat un cítric R2R3-MYB factor de transcripció CsMYBF1, que codifica una proteïna pertanyent al subgrup MYB específic de flavonol. El CsMYBF1 tenia la funció de controlar la 18
biosíntesi d'àcids de flavonol i hidrocincinnamines, i l'acumulació de metabòlits.. Flavonols i àcids hidroxicinàmics són importants metabòlits de fenilpropanoides a les plantes.
6. Beta-carotene hydroxylases 2, partial: és un pigment orgànic de color vermelltaronja abundant en plantes i fruites. És un membre dels carotens, que són terpenoides (isoprenoides), sintetitzats bioquímicament a partir de vuit unitats isoprens i, per tant, tenen 40 carbonis. Entre els carotens, el β-carotè es distingeix per tenir anells beta en tots dos extrems de la molècula.
7.
Limonoid glucosyltransferase: és un enzim que catalitza la reacció química: UDP-glucosa + limonina--->glucosil-limonina + UDP.
Així, els dos substrats
d'aquest enzim són UDP-glucosa (S'utilitza en el metabolisme de sucres nucleòtids com una forma activada de glucosa) i limonina, mentre que els seus dos productes són glucosil-limonina i UDP.
8. Putative citrus canker resistance protein 16R1-19R, partial: Les proteïnes quinasa activades per mitogen (MAPK) tenen funcions crucials en la immunitat vegetal. Anteriorment, es va identificar un MAPK cítric (CsMAPK1) com una proteïna expressada diferencialment en resposta a la infecció per Xanthomonas aurantifolii, un bacteri que causa càncer de cítrics a la llima mexicana, però una reacció hipersensible a les taronges dolces. Per investigar el paper de CsMAPK1 en la resistència als cítrics, podem expressar CsMAPK1 en plantes cítriques sota el control del promotor del gen PR5, que és induït per la infecció i la ferida de Xanthomonas. L'augment de l'expressió de CsMAPK1 es correlaciona amb una reducció dels símptomes de càncer i una disminució del creixement bacterià.
9. Miraculin-like protein 2, partial: La miraculina és un edulcorant natural. És un glucoproteïna extreta del fruit de la planta africana que pertany a la família sapotàcia, Synsepalum dulcificum. La baia d'aquesta planta conté polifenols actius. La miraculina en ella mateixa no és dolça, tanmateix després que les papil·les gustatives queden exposades a la miraculina els fruits àcids com les llimones es perceben com a dolços, l'efecte dura una hora.
19
10. Nucleotide binding site protein, partial: Aquesta subsecció de la secció 'Funció' descriu una regió en la proteïna que uneix nucleòtids fosfats. Sempre implica més d'un aminoàcid i inclou tots els residus implicats en l'enllaç de nucleòtids.
11. NBS-LRR type disease resistance protein, partial: El seu paper precís en el reconeixement és desconegut; no obstant això, es pensa que controlen l'estat de les proteïnes vegetals que són objectius dels patògens. Aquestes proteïnes grans i abundants participen en la detecció de diversos patògens, incloent bacteris, virus, fongs, nematodes, insectes i oomicets.
12. 4-coumarate-CoA ligase, partial 4-Coumarate: CoA ligases (4CLs) són un grup d'enzims essencials implicats en la via dels metabolismes compostos derivats de fenilpropanoides; no obstant això, encara és difícil identificar orthologs i paralogs d'aquests enzims importants basats només en la similitud de seqüència dels dominis conservats. Una 4-coumarato-CoA ligasa és un enzim que catalitza la reacció
química:
ATP + 4-coumarate + CoA ---><---AMP + difosfat + 4-coumaril-CoA. Els 3 substrats d'aquesta enzima són ATP , 4-coumarate i CoA , mentre que els seus 3 productes són AMP, difosfat i 4-coumaroyl-CoA.
13. Chitinase: Són enzims hidrolítics que descomponen els enllaços glicosídics en la quitina. Les quitinases també estan presents a les plantes. Algunes d'aquestes són proteïnes relacionades amb la patogènesi (PR) que s'introdueixen com a part de la resistència adquirida sistèmica. L'expressió està mesurada pel gen NPR1 i la via de l'àcid salicílic, tots dos implicats en la resistència a l'atac de fongs i insectes. Es poden requerir altres quitinases vegetals per crear simbiosis fúngica.
14. Pathogenesis response protein: Les proteïnes relacionades amb la patogènesi (PR) són proteïnes produïdes en plantes en cas d' atac patogen. S’ indueixen com a part de la resistència adquirida sistèmica. Les infeccions activen gens que produeixen proteïnes PR. Algunes d'aquestes proteïnes són antimicrobianes, ataquen molècules a la paret cel·lular d'un bacteri o fong. Uns altres poden funcionar com a senyals que divulguen "notícies" de la infecció a les cel·les properes. Les infeccions també estimulen l'entrecreuament de molècules a la paret 20
cel·lular i la deposició de lignina, respostes que configuren una barricada local que frena la propagació del patogen a altres parts de la planta.
15. Pectin methylesterase: La pectinesterasa (PE) és un enzim associat a la paret cel·lular ubiqua que presenta diverses isoformes que faciliten la modificació de la paret de les cèl·lules vegetals i el posterior desglossament. Es troba a totes les plantes superiors, així com en alguns bacteris i fongs. La pectinesterasa funciona fonamentalment per alterar el pH localitzat de la paret cel·lular, produint alteracions en la integritat de la paret cel·lular. La pectina és un dels principals components de la paret cel·lular vegetal. A les plantes, la pectinesterasa juga un paper important en el metabolisme de la paret cel·lular durant la maduració del fruit.
16. Limonoid UDP glucosyltransferase, partial: La limonina i altres compostos limonoides contribueixen al sabor amarg d'alguns productes alimentaris cítrics.
17. Malate dehydrogenase, partial: és un enzim que catalitza de manera reversible l'oxidació del malat al oxalacetat utilitzant la reducció de NAD + a NADH. Aquesta reacció forma part de moltes vies metabòliques, incloent el cicle d'àcid cítric.
18. Blight-associated protein P12, partial: La proteïna p12 s'acumula en fulles d'arbres amb malaltia cítrica (CB), un greu descens de causa desconeguda. La funció de p12 no es coneix, però l'anàlisi de la seqüència indica que pot estar relacionada amb expansions.
19. Aspartyl transcarbamylase, partial: Catalitza el primer pas en la via biosintètica de pirimidina.
20. Tyrosine decarboxylase: En l'enzimologia, una tirosina descarboxilasa és un enzim que catalitza la reacció química: L-tirosina---><---Tiramina + CO2. Per tant, aquest enzim té un substrat, L-tirosina, i dos productes, tiramina i diòxid de carboni. Aquesta enzim pertany a la família de les liases, concretament les carboxi-lyases, que escindeixen els enllaços carboni-carboni. Aquest enzim participa en el metabolisme de la tirosina i la biosíntesi d'alcaloides. 21. NHX1: Actua en interconnexió electroneutral de baixa afinitat de protons per a cations com Na + o K + a través de les membranes. També podeu canviar Li + i Cs 21
+ amb una menor afinitat. Implicat en la compartició de ions vacuolars necessaris per a la regulació del volum cel·lular i la desintoxicació Na + citoplasmàtica. Es requereix durant l'expansió de les fulles, probablement per estimular l'expansió cel·lular epidèrmica. Confereix la competència per créixer en condicions d'alta salinitat.
22. 9-cis-epoxycarotenoid dioxygenase 5: És un enzim que forma part de una ruta de biosintesi d’hormones vegetals. Després de veure la funció de cadascuna d’aquestes proteïnes ens centrarem amb les que intervenen amb el color, el gust, l’aroma i la resistència als patògens i malalties, és a dir, amb les característiques importants per al comerç de la mandarina.
22
5.3. COMPARACIÓ AMB ELS GENS D’INTERÈS En analitzar el gen amb el BLAST, ens sortiran resultats que no ens interessen (tots ells als annexos). Ens centrarem en les diferents varietats, esmentades anteriorment, de mandarines. ● Començarem amb l’enzim chalcone synthase que intervé en l’aroma: Hem trobat que aquest enzim es troba en les Citrus Clementina, però amb diferents percentatges d’igualtat, depenent del tipus de clementina. També es troba en les diferents Citrus sinensis (taronja dolça). Per tant, d’entrada podem dir que aquest tipus de mandarines poden arribar a tenir més aroma que les altres a causa d’aquest gent. La primera Clementina té una igualtat del 98%, amb 26 mutacions importants que es poden observar amb les següents imatges. (Es troben perquè les dues cadenes són diferents i per tant no hi ha una ratlla que les uneixi):
23
La segona Clementina tĂŠ una similitud del 79% amb 240 mutacions:
24
Per Ăşltim tenim la tercera clementina amb un 80% de similitud amb 236 mutacions:
25
● Un altre enzim és l’anomenat beta-carotene hydroxylases 2, partial, és l’encarregat del pigment orgànic vermell-taronja en les fruites. Hem trobat que aquest enzim es troba en la Citrus reticulata en una igualtat del 100%, és a dir, amb cap mutació:
26
● Un altre enzim és miraculin-like protein 2, partial, enzim que intervé
en les
papil·les gustatives per donar un sabor dolç. El podem comparar en 3 tipus de Clementines amb diferents mutacions però percentatges d’igualtat semblants. La primera Clementina té un 96% d’igualtat amb 20 mutacions:
La segona Clementina té un 96% de similitud amb 20 mutacions totalment diferents a les anteriors:
27
L’última Clementina té 2 mutacions i un 99% de semblança amb l’enzim:
● Un altre enzim és el limonoid UDP glucosyltranferase que intervé en el sabor amarg de les Citrus reticulata: El podem comparar amb una Citrus Clementina, una Citrus reticulata i una Citrus aurantium (un híbrid). La Citrus Clementina té un 100% d’igualtat amb el gen, és a dir, no hi ha cap mutació:
28
La Citrus aurantium té un 99% de semblança amb el gen i amb 8 mutacions:
Per últim tenim la Citrus reticulata amb un 99% d’igualtat i 12 mutacions:
29
● Un altre enzim és l’anomenat limonoid glucosyltransferase, el qual intervé en el gust i amb l’aroma que té. El podem trobar en tres tipus de Clementina, amb diferents percentatges d’igualtat i mutacions en les seves bases de l’ADN. La primera Clementina té un 100% d’igualtat, és a dir, sense cap mutació:
30
La segona Clementina tĂŠ un 98% dâ&#x20AC;&#x2122;igualtat, amb 36 mutacions:
31
I per Ăşltim, la tercera Clementina tĂŠ un 99%, amb 10 mutacions:
32
● Un enzim més és l’anomenat pectin methylesterase, el qual intervé en el sabor. El podem trobar en tres tipus de Clementines, les quals tenen diferents percentatges d’igualtat amb diferents mutacions. La primera Clementina té un 100% d’igualtat, per tant, amb cap mutació:
33
La segona Clementina tĂŠ un 99% dâ&#x20AC;&#x2122;igualtat amb 8 mutacions:
34
La tercera Clementina té un 74% d’igualtat amb 82 mutacions:
● Altre enzim és l’anomenat Pathogenesis response protein, el qual és important perquè intervé en cas d’atac de patògens. El trobem en dos tipus de Clementines amb diferents percentatges d’igualtat i mutacions. La primera Clementina té un 100% d’igualtat, és a dir, en cap mutació:
35
La segona Clementina té un 99% amb 2 mutacions:
● Un altre enzim és el Putative citrus canker resistance protein 16R1-19R gene, partial que intervé en la immunitat dels vegetals. El podem comparar amb 4 tipus de Citrus Clementina: 1a Citrus Clementina amb un 98% de semblança i amb 10 mutacions:
2a Clementina amb una igualtat del 97% amb 14 mutacions:
36
3a Clementina amb un 95% de similitud i 22 mutacions:
4a Clementina amb un 88% dâ&#x20AC;&#x2122;igualtat i amb 46 mutacions:
37
● Altre enzim és l’anomenat Blight-associated protein P12, partial, el qual està relacionat en expansions. El podem trobar en 7 tipus de Clementines, 1 Citrus aurantium, 1 Citrus nippokoreana i 1 Citrus unshiu amb diferents tipus de percentatges i mutacions. La primera Clementina té 100% d’igualtat, és a dir, amb cap mutació:
La segona Clementina té un 99% d’igualtat amb sols una mutació:
38
La tercera Clementina té un 99% d’igualtat amb 2 mutacions:
La quarta Clementina té un 99% d’igualtat amb sols 1 mutació:
La cinquena Citrus aurantium té un 96% d’igualtat amb 32 mutacions:
39
La sisena Citrus unshiu tĂŠ un 96% amb 33 mutacions:
40
La setena Citrus nippokoreana té un 95% d’igualtat amb 35 mutacions:
La vuitena Clementina té un 96% d’igualtat amb 31 mutacions:
41
La novena Clementina té un 99% d’igualtat amb 4 mutacions:
La desena Clementina té un 100% d’igualtat, amb cap mutació:
● L’enzim NBS-LRR type disease resistance protein, partial participa en la detecció de patògens. El podem comparar amb 8 tipus de mandarines diferents, d’entre elles 2 Clementines i 3 Citrus aurantium amb diferents percentatges i mutacions. També el comparem amb la Citrus unshiu i amb la Citrus nippokoreana, que són sinònims de la Citrus reticulata. La primera mandarina és la Citrus aurantium amb un 98% d’igualtat i 13 mutacions:
42
La segona mandarina és la Citrus reticulata amb un 100% d’igualtat i per tant cap mutació:
43
La tercera Ês la Citrus unshiu amb una semblança del 100%:
44
La quarta Ês la Citrus clementina amb un 95% de semblança i 41 mutacions:
45
La quinta mandarina ĂŠs a Citrus aurantium amb un 93% i 54 mutacions:
46
La sexta Ês la Citrus nippokoreana amb un 93% de semblança i 55 mutacions:
47
La sèptima mandarina Ês una Citrus aurantium però amb un percentatge del 93% i amb 61 mutacions:
48
La Ăşltima mandarina ĂŠs una Citrus clementina amb un 74% de similituds i 217 mutacions:
49
● Per últim tenim l’enzim Chitinase que esta relacionat amb la patogènesi. El podem comparar amb una Citrus reticulata i amb 3 Citrus clementina que tenen percentatges i mutacions diferents: Citrus reticulata amb un 100% d’igualtat:
50
Primera Citrus Clementina amb un 99% i amb 12 mutacions:
La segona Citrus Clementina tĂŠ una similitud del 97% amb 14 mutacions:
51
L’última Citrus Clementina té un 81% de semblances amb 113 mutacions:
52
5.4. QUADRE RESUM DELS ENZIMS COMPARATS ANTERIORMENT Enzim
Funció
Varietats
% d’igualtat
Nº de mutacions
Chalcone synthase
aromàtica
Clementina 1
98%
26
Clementina 2
79%
240
Clementina 3
80%
236
Citrus reticulata
100%
0
Clementina 1
96%
20
Clementina 2
96%
20
Clementina 3
99%
2
Clementina
100%
0
Citrus aurantium
99%
8
Citrus reticulata
99%
12
Clementina 1
100%
0
Clementina 2
98%
36
Clementina 3
99%
10
Clementina 1
100%
0
Clementina 2
99%
8
Clementina 3
74%
82
Beta-carotene
Encarregat del
hydroxylase 2
pigment orgànic vermell-taronja en les fruites
Miraculin-like
Intervé en el gust
protein
Limonoid UDP
Sabor amarg
glucosyltransferase
Limonoid
Gust i aroma
glucosyltransferase
Pectin methylesterase
Intervé en el sabor
53
Enzim
Funció
Varietats
% D’igualtat
Nº de mutacions
Pathogenesis response protein
Intervé en l’atac als patògens
Clementina 1
100%
0
Clementina 2
99%
2
Putative citrus canker resistance protein 16R1-19R gene
Immunitat dels vegetals
Clementina 1 Clementina 2 Clementina 3 Clementina 4
98% 97% 95% 88%
10 14 22 46
Blight-associated protein P12
Relacionat en les expansions
Clementina 1 Clementina 2 Clementina 3 Clementina 4 Citrus aurantium Citrus unshiu Citrus nippokoreana Clementina 5 Clementina 6 Clementina 7
100% 99% 99% 99% 96% 96% 95%
0 1 2 1 32 33 35
96% 99% 100%
31 4 0
Citrus aurantium 1 Citrus reticulata Citrus unshiu Clementina 1 Citrus aurantium 2 Citrus nippokoreana Citrus aurantium 3 Clementina 2
98% 100% 100% 95% 93% 93%
13 0 0 41 54 55
93% 74%
61 217
100% 99% 97% 81%
0 12 14 113
NBS-LRR type disease resistance
Chitinase
Detecció de patògens
Relacionat amb la Citrus reticulata patogènesi Clementina 1 Clementina 2 Clementina 3
54
6. Conclusions El treball ha estat complicat per diverses raons que esmentarem a continuació: En primer lloc, mai havíem realitzat un treball d’aquestes dimensions i estàvem una mica perdudes perquè no sabíem com fer-ho, necessitàvem un índex per començar a plantejarnos com estructurar, realitzar i redactar el nostre treball de recerca. En segon lloc, quasi tota la informació estava en anglès i ens dificultava i endarreria la feina perquè abans havíem de fer ús d’un traductor, un diccionari i del nostre nivell, el qual no estava massa avançat per al vocabulari complex que se’ns presentà. Tot i això ens hem sortit prou bé i no ha estat la dificultat més gran. També teníem problemes a l’hora de compaginar-nos per poder quedar i cercar juntes el necessari, aquesta dificultat ve donada pels diferents horaris de cadascuna de nosaltres, a més havíem de portar a cap la resta d’obligacions, com per exemple els estudis. Aquesta juntament amb el temps que anava transcorrent, és la dificultat més gran que hem trobat. Una altra dificultat important és que quan hem buscat la funció dels enzims, en alguns casos encara no se sabia amb exactitud i per tant, el resultat és causat per una aproximació del que se sap avui dia. Per últim dir que si hem trobat alguna dificultat pel que fa a l’àmbit científic, el nostre tutor ens ha resolt tots els dubtes, amb això i amb el que ja sabíem hem pogut continuar fàcilment i sense cap embús el nostre treball. L’objectiu, en un principi era: a partir de la bioinformàtica i de l’aplicació BLAST, trobar la mandarina perfecta sabent els gens que donen les característiques òptimes. El nostre objectiu no ha canviat a mesura que hem anat avançant, però no s’ha complit del tot. Hem aconseguit alguns gens, però com que no hi havia més programes de codificació, no sabem si hi ha més gens d’interès o només els nostres, per tant no podem fer una hipòtesi perfecta. A més, només ens sortia un tipus de mandarina (Citrus clementina) i algun híbrid, per tant tampoc podem saber amb exactitud si aquesta és la millor mandarina, si només aquesta té els gens d’interès i si per això és la més comuna o si les altres varietats de mandarines no els tenen. En conclusió, part de l’objectiu ha estat possible però a l’hora de fer hipòtesis no podem afirmar quina és la mandarina perfecta, per tant, no l’hem trobat, en un futur on hi hagin més gens codificats, amb un nivell superior i una recerca més profunda estem segures que es podria trobar.
55
Una vegada exposades les nostres dificultats i la conclusió de l’objectiu inicial, anem a exposar les conclusions trobades a partir del nostre treball, l’opinió i les hipòtesis que es poden extraure, que com hem dit adés no podem assegurar cap fiabilitat a causa de la “poca” informació. En primer lloc hem après que és la bioinformàtica de la qual, anteriorment, sols havíem sentit nomenar. Per a què serveix i sobretot hem vist què prospera amb una visió futurista. També ens hem adonat que abans de fer alguna cosa transgènica, que és que un organisme ha estat modificat genèticament afegint-li un gen per tal d’augmentar alguna qualitat, s’ha de fer bioinformàtica, i per tant és l’inici de les cures futures a les malalties, d’entre altres. En segon lloc també hem pogut observar la feina que hi ha darrere de la gent que es dedica i les hores que s’han d’invertir per a fer un model
acceptable i fiable amb
possibilitats de poder ser aplicat a la vida quotidiana. També hem pogut descobrir un camp de la biologia que de cara al final de curs pot ser una opció d’estudis universitaris i més endavant de possible ofici, així aconseguiríem el nivell suficient per acabar de resoldre aquest treball. El que hem extret de la pràctica és que la Citrus clementina, és una de les que té les característiques més optimes per a ser una candidata a mandarina perfecta (pel que fa al gust, color, aroma i resistència als patògens). El que falla en aquest programa és que no podem saber de quina varietat de Citrus Clementina es tracta i per tant, ens surten moltes clementines amb diferents mutacions però no podem saber quina és la mutació excel·lent i el tipus de mandarina que la dóna. Això es complica encara més amb els híbrids obtinguts, ja que no sabem de quina varietat es tracta ni de quines dues mandarines prové. Pel que fa a la varietat Satsuma, no sabem si tenen els gens aquests, si en tenen uns altres o si simplement no estan codificats però són aquests, per tan tampoc podem saber les diferents mutacions, però no ha estat una dificultat perquè aquests tipus de mandarines no són tan comercials com les anteriors, s’utilitzen en alguns camps industrials, però no estan cultivades per al seu consum, tot i això, algunes tenen una bona qualitat gustativa. Pel que fa a les varietats de mandarines, pensem que influeix més el clima i l’entorn per a desenvolupar una sèrie de característiques o activar uns gens que no d’on provenen, en el cas dels híbrids és fàcil d’explicar: influeix més el clima per a donar unes característiques que no el creuament de les dues mandarines per a donar lloc a l’híbrid, així doncs, aquest pot tenir unes característiques que els seus “antecessors” no tenen. 56
Per finalitzar amb les nostres conclusions, avui en dia els vivers i comerços de mandarines estan esperant que surti una mutació en els gens que doni lloc a un tipus de mandarina la qual tingui totes les característiques òptimes per a ser comercialitzada. El problema que hi ha és que la natura no és perfecta i sempre hi ha mutacions en l’ADN i per tant és quasi impossible que doni la situació. En el cas que es donés, els seus descendents igual patirien mutacions per veure si són millors i per tant, a la llarga es tornaria a perdre. Aquest problema es pot solucionar a partir de la bioinformàtica i la transgènesi, ja que amb la bioinformàtica es poden trobar tots els gens i les mutacions òptimes, com hem vist al llarg d’aquest treball, i amb la trangènesi podem modificar amb aquests gens excel·lents els organismes, en aquest cas les mandarines, i poder arribar a la perfecció. Segurament hi haurà més problemes quan es faci, ja que la gent dirà que és un quelcom artificial, però en realitat, l’únic que es fa és modificar l’ADN, una acció que la natura fa habitualment, per tant, seria igual de natural que la resta de mandarines. Si s’aconsegueix això, no faria falta tenir moltes varietats de mandarines, ja que amb una ens sortiríem, en cas contrari, amb el triatge que fem amb les eines de bioètica, avui en dia es pot dissenyar noves varietats que inclourien la introducció o modificació de gens d’altres varietats que s’assemblen molt i que milloren les propietats de la varietat de mandarina escollida, i que s’aplicarien al laboratori mitjançant la tècnica crisp-cas9 i altres innovacions. Així, es pot fer una hibridació molecular per aconseguir varietats que milloren el gust, l’acidesa, la resistència a plagues, la maduració del fruit o el manteniment en càmeres de fred, en funció del mercat, i que permetrien al llaurador, les cooperatives i els vivers una millor interrelació amb la demanda i l’oferta, amb previsions de producció, augment de l’emmagatzematge, millora en transport, apertura de nous mercats, augment de superfícies cultivables amb reducció de costos, o estalvis en productes fitosanitaris, és a dir, una veritable revolució agrícola amb l’ús de la tecnologia molecular emergent. En conclusió, el futur per a trobar la mandarina perfecta comença aquí.
57
7. Glossari Microarrays: Un xip d'ADN és una superfície sòlida a la qual s'uneix una col·lecció de fragments de DNA. Les superfícies emprades per fixar l'ADN són molt variables i poden ser de vidre, plàstic i fins i tot de silicona. Els xips d'ADN es fan servir per analitzar la expressió diferencial de gens, i es monitoritzen de manera simultània els nivells de milers d'ells. Hibridació: Tècnica consistent a separar dos brins d’ADN i associar-los posteriorment amb brins de ARN d’altres espècies d’individus, o bé del mateix.
Espectrometria de masses: L'espectrometria de masses és una tècnica experimental que permet la mesura de ions derivats d'una molècula. L'espectròmetre de masses és un instrument que permet analitzar amb gran precisió la composició de diferents elements químics i isòtops atòmics, separant els nuclis atòmics en funció de la seva relació massacàrrega (m/z).
Algoritmes: És un conjunt finit d'instruccions o passos que serveixen per a executar una tasca o resoldre un problema. Polimorfismes: Presència de diverses formes d’un caràcter o d’un gen en una població.
Homologia: La homologia és la relació que existeix entre dues parts orgàniques diferents quan els seus determinants genètics tenen el mateix origen evolutiu. Hi ha homologia entre òrgans determinats de dues espècies diferents, quan ambdós deriven de l'òrgan corresponent del seu avantpassat comú, amb independència de com dispars puguin haver arribat a ser.
Modelatge per homologia: Aquesta informació es fa servir per predir l'estructura d'una proteïna un cop coneguda l'estructura d'una proteïna homòloga. Anàlisi ortòleg: L’anàlisi de les seqüències de dues o més proteïnes o àcids nucleics que són similars entre si pel fet que presenten un mateix origen evolutiu.
58
Poliploïdia: Fenomen que dona lloc a que una cèl·lula tingui tres o més dotacions completes de cromosomes.
Endosimbiosis: S'anomena endosimbiosi a l'associació en la qual un organisme habita a l'interior d'un altre organisme. Etimològicament el terme podria usar-se per a designar a qualsevol procés de simbiosi en el qual el simbiont resideix a l'interior del cos d'un altre ésser viu Models de parsimònia: Tracta d’un model, el qual és de tranquil·litat i lentitud.
Ontologies: Una ontologia és una definició formal de tipus, propietats, i relacions entre entitats que realment o fonamentalment existeixen per a un domini de discussió en particular.
Fag: És un mena de virus que sols infecta a bacteris. Paral·lelament als virus, que infecten eucariotes, els fags consisteixen en un recobriment extern proteic que conté el material genètic, el qual consisteix en una doble hèlix d'ADN en el 2% dels fangs coneguts.
Seqüenciació: En bioquímica, consisteix a determinar l'ordre linear dels components d'una macromolècula (els aminoàcids d'una proteïna, els nucleòtids d'un àcid nucleic com l'ADN, els monosacàrids d'un polisacàrid...). En genètica, la seqüenciació concerneix la determinació de la seqüència dels gens fins i tot dels cromosomes, i del genoma complet.
Heurística: És una forma de treball per resoldre problemes, aprendre o fer descobriments que utilitza mètodes pràctics, que no garanteixen una solució òptima o perfecta, encara que suficient pels objectius immediats.
Hidròlisi: És una solvòlisi on el dissolvent és l'aigua. Es tracta, doncs, d'una reacció química de doble descomposició on un dels reactius és l'aigua, que al mateix temps és el dissolvent de la dissolució on el solut és l'altre reactiu.
Oxiradicals: Qualsevol d'un grup de radicals que conté àtoms d'oxigen reactiu. 59
Cetona: És un compost orgànic caracteritzat per posseir un grup funcional carbonil unit a dos àtoms de carboni, a diferència d'un aldehid, on el grup carbonil es troba unit a mínim a un àtom d'hidrogen.
Promotor: En genètica un promotor és una regió de DNA que controla la iniciació de la transcripció d'una determinada porció de l'ADN a ARN. Un promotor per tant, promou la transcripció d'un gen.
Pigment: És un material que canvia el color de la llum que reflecteix com a resultat de l'absorció selectiva del color.
Mitogen: És una substància química que fomenta una cèl·lula per iniciar la divisió cel·lular, provocant mitosi. Un mitogen sol ser una forma d'una proteïna.
Edulcorant: És la substància que proporciona a un aliment un gust dolç.
Polifenol: Són un grup de substàncies químiques trobades en plantes caracteritzades per la presència de més d'un grup fenol per molècula.
Oomicet: Són organismes filamentosos microscòpics que es reprodueixen tant de forma sexual com asexual. Els oomicets ocupen nínxols sapròfits i patògens inclouen molts dels patògens de plantes.
Fenilpropanoide: Són molècules naturals que provenen de la ruta de l'àcid shikímic. En plantes, el primer pas és l'eliminació del nitrogen de la fenilalanina en forma d'amoníac per generar l'àcid trans-cinàmic. Lignina: És una classe de polímers orgànics complexos que formen materials estructurals importants en els teixits de suport de plantes vasculars i d'algunes algues. Transgènesi: És el procés d’introduir un gen exogen, anomenat un transgen, dins un organisme viu. Així, l’organisme mostrarà una nova propietat i la transmetrà a la seva descendència.
60
8. Agraïments Volem agrair l’ajuda, que ens ha permès seguir endavant i poder millorar amb bons resultats, a tres persones: En primer lloc, el nostre tutor del treball, Fernando Juan Boix, que sense la seva ajuda aquest TDR no hagués estat possible. En segon lloc, Marc Chillida Fibla, exalumne del nostre institut, que ens ha deixat part de documentació d’una assignatura que tenia a la carrera universitària per poder informarnos més sobre la bioinformàtica. Per últim a Josep Vea Fibla, exalumne de l’institut i estudiant de disseny gràfic, creador de la nostra portada i contraportada d’aquest treball.
9. Webgrafia https://www.ncbi.nlm.nih.gov/pubmed/25114170 NCBI (10/08/17) http://onlinelibrary.wiley.com/doi/10.1111/j.1399-3054.1997.tb04779.x/full)
ONLINE
LIBRARY (07/12/17) http://onlinelibrary.wiley.com/doi/10.1016/S0014-5793(00)01275-8/full ONLINE LIBRARY (18/12/17) http://onlinelibrary.wiley.com/doi/10.1016/S0014-5793(00)01275-8/full ONLINE LIBRARY (11/01/18) https://es.wikipedia.org/wiki/Chalcona WIKIPEDIA CHALCONE (15/09/17) https://www.ncbi.nlm.nih.gov/pubmed/27162196 NCBI (20/09/17) http://www.frutas-hortalizas.com/Frutas/Tipos-variedades-Mandarina.html
FRUITES
(21/10/17) http://bioinformatica.uab.cat/genetica_tfg/bioinformaticaabast/Qu%C3%A9_es.html
UAB
BIOINFORMÀTICA (12/05/17) https://www.ncbi.nlm.nih.gov/protein NCBI (6/12/17) https://es.wikipedia.org/wiki/Mandarina WIKIPEDIA MANDARINA (15/09/17) https://es.wikipedia.org/wiki/Bioinform%C3%A1tica#Historia WIKIPEDIA BIOINFORMÀTICA (12/05/17) https://www.ncbi.nlm.nih.gov/pubmed/24634194 NCBI (17/10/17) https://books.google.es/books?isbn=9401792852 BOOKS (20/09/17) http://www.genome.jp/dbget-bin/www_bget?ec:1.14.13.129) GENOME (17/10/17) http://www.uniprot.org/help/np_bind UNIPROT (18/12/17) 61
http://www.uniprot.org/uniprot/Q9XFX5) UNIPROT (18/12/17) https://genomebiology.biomedcentral.com/articles/10.1186/gb-2006-7-4-212 GENOMEBIOLOGY (17/10/17) https://ca.wikipedia.org/wiki/Malat_deshidrogenasa WIKIPEDIA MALAT (20/09/17) https://en.wikipedia.org/wiki/Chitinase WIKIPEDIA CHITINASE (20/09/17) http://www.uniprot.org/uniprot/Q68KI4 UNIPROT (18/12/17) https://dlc.iec.cat/results.asp DLC.IEC (18/10/17) https://es.wikipedia.org/wiki/Lignina (11/01/18) LIGNINA
62
63
10. Annexos
CHALCONE SYNTHASE:
64
65
1a clementina:
66
2a clementina:
67
3a clementina:
68
MIRACULIN-LIKE PROTEIN 2, PARTIAL:
69
1a Clementina:
2a Clementina:
70
3a Clementina:
LIMONOID UDP GLUCOSYL TRANSFERASE:
71
72
1a Clementina:
73
Citrus aurantium:
74
Citrus reticulata:
75
PUTATIVE CITRUS CANKER RESISTANCE PROTEIN 16R1-19R GENE, PARTIA:
76
1a Clementina:
2a Clementina:
77
3a Clementina:
4a Clementina:
78
NBS-LRR TYPE DISEASE RESISTANCE PROTEIN, PARTIAL:
79
Citrus reticulata:
80
Citrus unshiu:
81
Citrus aurantium:
82
Citrus clementina:
83
Citrus aurantium:
84
Citrus nippokoreana:
85
Citrus aurantium:
86
Citrus clementina:
87
BETA-CAROTENE HYDROXYLASES 2, PARTIAL:
Citrus reticulata:
88
CHITINASE:
89
Citrus reticulata:
90
1a Citrus Clementina:
91
2a Citrus Clementina:
92
Ă&#x161;ltima Citrus Clementina:
93
LIMONOID GLUCOSYLTRANSFERASE:
94
1a Clementina:
2a Clementina:
95
3a Clementina:
PECTIN METHYLESTERASE:
96
1a Clementina:
97
2a Clementina:
98
3a Clementina:
PATHOGENESIS RESPONSE PROTEIN:
99
1a Clementina:
2a Clementina:
100
BLIGHT-ASSOCIATED PROTEIN P12:
101
1a Clementina:
102
2a Clementina:
3a Clementina:
103
4a Clementina:
5a Clementina:
104
6a Clementina:
7a Clementina:
105
8a Clementina:
9a Clementina:
106
10a Clementina:
107