FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1965, 529 aa 1>>>pF1KE1965 529 - 529 aa - 529 aa Library: human.CCDS.faa 18921897 residues in 33420 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5137+/-0.000823; mu= 17.7280+/- 0.050 mean_var=77.7352+/-15.130, 0's: 0 Z-trim(108.6): 21 B-trim: 30 in 2/50 Lambda= 0.145467 statistics sampled from 10418 (10428) to 10418 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.691), E-opt: 0.2 (0.312), width: 16 Scan time: 1.400 The best scores are: opt bits E(33420) CCDS8284.1 TYR gene_id:7299|Hs109|chr11 ( 529) 3753 797.3 0 CCDS34990.1 TYRP1 gene_id:7306|Hs109|chr9 ( 537) 1400 303.4 4.3e-82 CCDS9470.1 DCT gene_id:1638|Hs109|chr13 ( 519) 1389 301.1 2.1e-81 CCDS45060.1 DCT gene_id:1638|Hs109|chr13 ( 552) 1179 257.1 4e-68 >>CCDS8284.1 TYR gene_id:7299|Hs109|chr11 (529 aa) initn: 3753 init1: 3753 opt: 3753 Z-score: 4256.4 bits: 797.3 E(33420): 0 Smith-Waterman score: 3753; 100.0% identity (100.0% similar) in 529 aa overlap (1-529:1-529) 10 20 30 40 50 60 pF1KE1 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSPCGQLSGRGSCQNILL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSPCGQLSGRGSCQNILL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 SNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNCTERRLLVR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 SNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNCTERRLLVR 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 RNIFDLSAPEKDKFFAYLTLAKHTISSDYVIPIGTYGQMKNGSTPMFNDINIYDLFVWMH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 RNIFDLSAPEKDKFFAYLTLAKHTISSDYVIPIGTYGQMKNGSTPMFNDINIYDLFVWMH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 YYVSMDALLGGSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTGDENFTIPYWDWRD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 YYVSMDALLGGSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTGDENFTIPYWDWRD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 AEKCDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQSLCNGTPEGPLRRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 AEKCDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQSLCNGTPEGPLRRN 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 PGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLEGFASPLTGIADASQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 PGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLEGFASPLTGIADASQS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 SMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRRHRPLQEVYPEANAPIGH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 SMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRRHRPLQEVYPEANAPIGH 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 NRESYMVPFIPLYRNGDFFISSKDLGYDYSYLQDSDPDSFQDYIKSYLEQASRIWSWLLG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 NRESYMVPFIPLYRNGDFFISSKDLGYDYSYLQDSDPDSFQDYIKSYLEQASRIWSWLLG 430 440 450 460 470 480 490 500 510 520 pF1KE1 AAMVGAVLTALLAGLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQSHL ::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 AAMVGAVLTALLAGLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQSHL 490 500 510 520 >>CCDS34990.1 TYRP1 gene_id:7306|Hs109|chr9 (537 aa) initn: 1325 init1: 454 opt: 1400 Z-score: 1587.5 bits: 303.4 E(33420): 4.3e-82 Smith-Waterman score: 1439; 41.3% identity (66.2% similar) in 538 aa overlap (3-524:9-529) 10 20 30 40 50 pF1KE1 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCP---PWSGDRSP-CGQLS :. .. : :: . ..::: :.. . : ::: : :: . ::. : CCDS34 MSAPKLLSLGCIFFPLLLFQQARAQFPRQCATVEALRSGMCCPDLSPVSGPGTDRCGSSS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 GRGSCQNILLSNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGP ::: :. . .. : .::.: : :::: :: :.::::.:.::: : :::.:. :. : CCDS34 GRGRCEAVTADSRPHSPQYPHDGRDDREVWPLRFFNRTCHCNGNFSGHNCGTCRPGWRGA 70 80 90 100 110 120 120 130 140 150 160 pF1KE1 NCTERRLLVRRNIFDLSAPEKDKFFAYLTLAKHTISSDYVIPIGTYGQM--KNGSTPMFN : .: :.::::..::: ::..: : .::.: .:: .. .:.::.:. CCDS34 ACDQRVLIVRRNLLDLSKEEKNHFVRALDMAKRTTHPLFVIATRRSEEILGPDGNTPQFE 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE1 DINIYDLFVWMHYYVSMDALLG-GSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTG .:.::. ::: ::: ..:: :.: . ..::.::.:::: ::: ::: :...:.. CCDS34 NISIYNYFVWTHYYSVKKTFLGVGQESFGEVDFSHEGPAFLTWHRYHLLRLEKDMQEMLQ 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE1 DENFTIPYWDWRDAEK-CDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQ . .:..:::.. ... ::::::. ::.. . .:.:: : ::.:..::. ::.:.. CCDS34 EPSFSLPYWNFATGKNVCDICTDDLMGSRSNFDSTLISPNSVFSQWRVVCDSLEDYDTLG 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE1 SLCNGTPEGPLRRNP-GNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLE .:::.: .::.:::: :: . . ::: :: :: . ... . . .. :::::.: CCDS34 TLCNSTEDGPIRRNPAGNVARPMVQRLPEPQDVAQCLEVGLFDTPPFYSNSTNSFRNTVE 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE1 GFASPLTGIADASQSSMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRRHR :...: :: : . :.:: :...::: .:.. : :::::.: :.:.:..:..::::. CCDS34 GYSDP-TGKYDPAVRSLHNLAHLFLNGTGGQTHLSPNDPIFVLLHTFTDAVFDEWLRRYN 370 380 390 400 410 410 420 430 440 450 460 pF1KE1 PLQEVYPEANAPIGHNRESYMVPFIPLYRNGDFFISSKD-LGYDYSYLQDSDPDSFQDYI ..: ::::::::. :::: : : ..:... : ::: : : : . : CCDS34 ADISTFPLENAPIGHNRQYNMVPFWPPVTNTEMFVTAPDNLGYTYEIQWPSREFSVPEII 420 430 440 450 460 470 470 480 490 500 510 pF1KE1 KSYLEQASRIWSWLLGAAMVGAVL-TALLAGLVSLLCRHKRKQLPEEKQPLLMEK----- . :.:::.: .::. : .: : : :... : .:::: .. CCDS34 ---------------AIAVVGALLLVALIFGTASYLIR-ARRSMDEANQPLLTDQYQCYA 480 490 500 510 520 520 pF1KE1 EDYHSLYQSHL :.:..: CCDS34 EEYEKLQNPNQSVV 530 >>CCDS9470.1 DCT gene_id:1638|Hs109|chr13 (519 aa) initn: 1053 init1: 325 opt: 1389 Z-score: 1575.3 bits: 301.1 E(33420): 2.1e-81 Smith-Waterman score: 1391; 40.1% identity (68.9% similar) in 521 aa overlap (2-515:9-506) 10 20 30 40 50 pF1KE1 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSP-CGQLSGR ::. : : . . . :.:::.:.. .:..::::: ... . ::. .:: CCDS94 MSPLWWGFLLSCLGCKI--LPGAQGQFPRVCMTVDSLVNKECCPRLGAESANVCGSQQGR 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 GSCQNILLSNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNC :.: .. .. : . . . . :::: :: :..:::.:.::: :.:::.::::. :::: CCDS94 GQCTEVRADTRPWSGPYILRNQDDRELWPRKFFHRTCKCTGNFAGYNCGDCKFGWTGPNC 60 70 80 90 100 110 120 130 140 150 160 pF1KE1 TERRL-LVRRNIFDLSAPEKDKFFAYLTLAKHTISSDYVIP----IGTYGQMKNGSTPMF ... ..:.:: .:: :...:.. : :::. . :::: .: : ::. :.: CCDS94 ERKKPPVIRQNIHSLSPQEREQFLGALDLAKKRVHPDYVITTQHWLGLLG--PNGTQPQF 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 NDINIYDLFVWMHYYVSMDALLGGSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTG . ..::.:::.::: :.::: .. .: :::.:..:::. ::: :: :...:.: : CCDS94 ANCSVYDFFVWLHYYSVRDTLLGPGRPYRAIDFSHQGPAFVTWHRYHLLCLERDLQRLIG 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 DENFTIPYWDWRDAE-KCDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQ .:.:..:::.. .. .::.:::. .:. .: .:.:.: : ::::. ::. :..:: CCDS94 NESFALPYWNFATGRNECDVCTDQLFGAARPDDPTLISRNSRFSSWETVCDSLDDYNHLV 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 SLCNGTPEGPLRRNPGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLEG .::::: :: :::: ... . .::. :.. :::: .... . . ..:::::.::: CCDS94 TLCNGTYEGLLRRNQMGRN---SMKLPTLKDIRDCLSLQKFDNPPFFQNSTFSFRNALEG 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE1 FASPLTGIADASQSSMHNALHIYMNGTMSQVQGSANDPIFLLHHAFVDSIFEQWLRRHRP : . : :.. :.:: .: ..::: . ...::::::.. :.:.:.::..:..: : CCDS94 FDKA-DGTLDSQVMSLHNLVHSFLNGTNALPHSAANDPIFVVLHSFTDAIFDEWMKRFNP 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE1 LQEVYPEANAPIGHNRESYMVPFIPLYRNGDFFISSKDLGYDYSYLQDSDPDSFQDYIKS ...:. ::::::: ::::.: : ..:..: .:::.:. : : CCDS94 PADAWPQELAPIGHNRMYNMVPFFPPVTNEELFLTSDQLGYSYAI----------DLPVS 420 430 440 450 460 470 480 490 500 510 520 pF1KE1 YLEQASRIWSWLLGAAMVGAVLTALLAGLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQ : . : : ..: ..:.::. :: :: . ..: . ::. CCDS94 VEETPG--WPTTLLVVM--GTLVALV-GLFVLLAFLQYRRLRKGYTPLMETHLSSKRYTE 470 480 490 500 510 pF1KE1 SHL CCDS94 EA >>CCDS45060.1 DCT gene_id:1638|Hs109|chr13 (552 aa) initn: 1097 init1: 313 opt: 1179 Z-score: 1336.7 bits: 257.1 E(33420): 4e-68 Smith-Waterman score: 1322; 38.1% identity (65.0% similar) in 554 aa overlap (2-515:9-539) 10 20 30 40 50 pF1KE1 MLLAVLYCLLWSFQTSAGHFPRACVSSKNLMEKECCPPWSGDRSP-CGQLSGR ::. : : . . . :.:::.:.. .:..::::: ... . ::. .:: CCDS45 MSPLWWGFLLSCLGCKI--LPGAQGQFPRVCMTVDSLVNKECCPRLGAESANVCGSQQGR 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 GSCQNILLSNAPLGPQFPFTGVDDRESWPSVFYNRTCQCSGNFMGFNCGNCKFGFWGPNC :.: .. .. : . . . . :::: :: :..:::.:.::: :.:::.::::. :::: CCDS45 GQCTEVRADTRPWSGPYILRNQDDRELWPRKFFHRTCKCTGNFAGYNCGDCKFGWTGPNC 60 70 80 90 100 110 120 130 140 150 160 pF1KE1 TERRL-LVRRNIFDLSAPEKDKFFAYLTLAKHTISSDYVIP----IGTYGQMKNGSTPMF ... ..:.:: .:: :...:.. : :::. . :::: .: : ::. :.: CCDS45 ERKKPPVIRQNIHSLSPQEREQFLGALDLAKKRVHPDYVITTQHWLGLLG--PNGTQPQF 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE1 NDINIYDLFVWMHYYVSMDALLGGSEIWRDIDFAHEAPAFLPWHRLFLLRWEQEIQKLTG . ..::.:::.::: :.::: .. .: :::.:..:::. ::: :: :...:.: : CCDS45 ANCSVYDFFVWLHYYSVRDTLLGPGRPYRAIDFSHQGPAFVTWHRYHLLCLERDLQRLIG 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE1 DENFTIPYWDWRDAE-KCDICTDEYMGGQHPTNPNLLSPASFFSSWQIVCSRLEEYNSHQ .:.:..:::.. .. .::.:::. .:. .: .:.:.: : ::::. ::. :..:: CCDS45 NESFALPYWNFATGRNECDVCTDQLFGAARPDDPTLISRNSRFSSWETVCDSLDDYNHLV 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 SLCNGTPEGPLRRNPGNHDKSRTPRLPSSADVEFCLSLTQYESGSMDKAANFSFRNTLEG .::::: :: :::: ... . .::. :.. :::: .... . . ..:::::.::: CCDS45 TLCNGTYEGLLRRNQMGRN---SMKLPTLKDIRDCLSLQKFDNPPFFQNSTFSFRNALEG 300 310 320 330 340 350 350 360 370 380 pF1KE1 FASPLTGIADASQSSMHNALHIYMNGTMSQVQGSANDPIFL------------------- : . : :.. :.:: .: ..::: . ...::::::. CCDS45 FDKA-DGTLDSQVMSLHNLVHSFLNGTNALPHSAANDPIFVVISNRLLYNATTNILEHVR 360 370 380 390 400 410 390 400 410 420 430 pF1KE1 ----------LH----HAFVDSIFEQWLRRHRPLQEVYPEANAPIGHNRESYMVPFIPLY :: :.:.:.::..:..: : ...:. ::::::: ::::.: CCDS45 KEKATKELPSLHVLVLHSFTDAIFDEWMKRFNPPADAWPQELAPIGHNRMYNMVPFFPPV 420 430 440 450 460 470 440 450 460 470 480 490 pF1KE1 RNGDFFISSKDLGYDYSYLQDSDPDSFQDYIKSYLEQASRIWSWLLGAAMVGAVLTALLA : ..:..: .:::.:. : : : . : : ..: ..:.::. CCDS45 TNEELFLTSDQLGYSYAI----------DLPVSVEETPG--WPTTLLVVM--GTLVALV- 480 490 500 510 500 510 520 pF1KE1 GLVSLLCRHKRKQLPEEKQPLLMEKEDYHSLYQSHL :: :: . ..: . ::. CCDS45 GLFVLLAFLQYRRLRKGYTPLMETHLSSKRYTEEA 520 530 540 550 529 residues in 1 query sequences 18921897 residues in 33420 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Jul 3 20:42:49 2020 done: Fri Jul 3 20:42:49 2020 Total Scan time: 1.400 Total Display time: 0.050 Function used was FASTA [36.3.4 Apr, 2011]