FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6407, 496 aa 1>>>pF1KE6407 496 - 496 aa - 496 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 4.7889+/-0.00103; mu= 21.0383+/- 0.062 mean_var=65.6951+/-13.487, 0's: 0 Z-trim(102.3): 33 B-trim: 0 in 0/51 Lambda= 0.158237 statistics sampled from 6883 (6894) to 6883 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.572), E-opt: 0.2 (0.212), width: 16 Scan time: 1.980 The best scores are: opt bits E(32554) CCDS2468.1 SLC19A3 gene_id:80704|Hs108|chr2 ( 496) 3226 745.8 2.4e-215 CCDS1280.1 SLC19A2 gene_id:10560|Hs108|chr1 ( 497) 1607 376.3 4.4e-104 CCDS81398.1 SLC19A2 gene_id:10560|Hs108|chr1 ( 296) 767 184.3 1.6e-46 CCDS56218.1 SLC19A1 gene_id:6573|Hs108|chr21 ( 489) 682 165.1 1.6e-40 CCDS13725.1 SLC19A1 gene_id:6573|Hs108|chr21 ( 591) 682 165.1 1.8e-40 CCDS56217.1 SLC19A1 gene_id:6573|Hs108|chr21 ( 551) 555 136.1 9.3e-32 >>CCDS2468.1 SLC19A3 gene_id:80704|Hs108|chr2 (496 aa) initn: 3226 init1: 3226 opt: 3226 Z-score: 3979.6 bits: 745.8 E(32554): 2.4e-215 Smith-Waterman score: 3226; 100.0% identity (100.0% similar) in 496 aa overlap (1-496:1-496) 10 20 30 40 50 60 pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLTSAEITNEIFPVWT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLTSAEITNEIFPVWT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 YSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQVVEFFYGMVTAAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 YSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQVVEFFYGMVTAAE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 VAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANMSYFYLNVISLASV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 VAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANMSYFYLNVISLASV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 SVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPGCEEQKPTSEILST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 SVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPGCEEQKPTSEILST 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 SGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAFATAGFNQVLNYVQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 SGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAFATAGFNQVLNYVQ 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 ILWDYKAPSQDSSIYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGELALVVFSVVNAGSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 ILWDYKAPSQDSSIYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGELALVVFSVVNAGSL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 FLMHYTANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERYALVFGINTFIALVIQTI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 FLMHYTANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERYALVFGINTFIALVIQTI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 MTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMYITYSTKSQKDVQSPAPSENPD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS24 MTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMYITYSTKSQKDVQSPAPSENPD 430 440 450 460 470 480 490 pF1KE6 VSHPEEESNIIMSTKL :::::::::::::::: CCDS24 VSHPEEESNIIMSTKL 490 >>CCDS1280.1 SLC19A2 gene_id:10560|Hs108|chr1 (497 aa) initn: 1612 init1: 879 opt: 1607 Z-score: 1982.1 bits: 376.3 E(32554): 4.4e-104 Smith-Waterman score: 1607; 52.1% identity (79.4% similar) in 466 aa overlap (12-472:30-490) 10 20 30 40 pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGP :. ::..:: .:::. .::::::: ::: :: CCDS12 MDVPGPVSRRAAAAAATVLLRTARVRRECWFLPTALLCAYGFFASLRPSEPFLTPYLLGP 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE6 DKNLTSAEITNEIFPVWTYSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQG ::::: :. :::.:::::::::::.:::. :::.:::::..:::.:.:.::..::..:: CCDS12 DKNLTEREVFNEIYPVWTYSYLVLLFPVFLATDYLRYKPVVLLQGLSLIVTWFMLLYAQG 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE6 VKTMQVVEFFYGMVTAAEVAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLV . ..: .:::::..::.:.:::.::::::. ::.:..::::.::...:.::::.:.:: CCDS12 LLAIQFLEFFYGIATATEIAYYSYIYSVVDLGMYQKVTSYCRSATLVGFTVGSVLGQILV 130 140 150 160 170 180 170 180 190 200 210 pF1KE6 SLANMSYFYLNVISLASVSVAFLFSLFLPMPKKSMFFHAKPSREIK----KSSSVNPVLE :.:. : : ::::::. ::::: . :::::.::.::: :: . : .. . : . CCDS12 SVAGWSLFSLNVISLTCVSVAFAVAWFLPMPQKSLFFHHIPSTCQRVNGIKVQNGGIVTD 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE6 ETHEGEAPGCEEQKPTSEILSTSGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRL .. :: :. . . ... . ::. . : . : : .:. ::::. : CCDS12 TPASNHLPGWEDIESKIPLNMEEPPVEEPE---PKPDRLLV-LKVLW-NDFLMCYSSRPL 250 260 270 280 290 280 290 300 310 320 330 pF1KE6 FYWSLWWAFATAGFNQVLNYVQILWDYKAPSQDSSIYNGAVEAIATFGGAVAAFAVGYVK . ::.:::..: :. ::.::.: ::. ::. ..::::.:::..:. ::::.:::::.: CCDS12 LCWSVWWALSTCGYFQVVNYTQGLWEKVMPSRYAAIYNGGVEAVSTLLGAVAVFAVGYIK 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE6 VNWDLLGELALVVFSVVNAGSLFLMHYTANIWACYAGYLIFKSSYMLLITIAVFQIAVNL ..:. ::..: .::.. :.....: ..:::.:::.:..:. ::::::::.::::.:: CCDS12 ISWSTWGEMTLSLFSLLIAAAVYIMDTVGNIWVCYASYVVFRIIYMLLITIATFQIAANL 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE6 NVERYALVFGINTFIALVIQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMR-S ..::::::::.::::::..::..:.:::: ::.: .. :::.:.::::.:: .:: . CCDS12 SMERYALVFGVNTFIALALQTLLTLIVVDASGLGLEITTQFLIYASYFALIAVVFLASGA 420 430 440 450 460 470 460 470 480 490 pF1KE6 MYITYSTKSQKDVQSPAPSENPDVSHPEEESNIIMSTKL . . . .. .: :: CCDS12 VSVMKKCRKLEDPQSSSQVTTS 480 490 >>CCDS81398.1 SLC19A2 gene_id:10560|Hs108|chr1 (296 aa) initn: 918 init1: 747 opt: 767 Z-score: 948.8 bits: 184.3 E(32554): 1.6e-46 Smith-Waterman score: 767; 51.6% identity (81.9% similar) in 221 aa overlap (253-472:71-289) 230 240 250 260 270 280 pF1KE6 GEAPGCEEQKPTSEILSTSGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWS ::. . : . : : .:. ::::. :. :: CCDS81 GFFASLRPSEPFLTPYLLGPDKNLTEREEPKPDRLLV-LKVLW-NDFLMCYSSRPLLCWS 50 60 70 80 90 290 300 310 320 330 340 pF1KE6 LWWAFATAGFNQVLNYVQILWDYKAPSQDSSIYNGAVEAIATFGGAVAAFAVGYVKVNWD .:::..: :. ::.::.: ::. ::. ..::::.:::..:. ::::.:::::.:..:. CCDS81 VWWALSTCGYFQVVNYTQGLWEKVMPSRYAAIYNGGVEAVSTLLGAVAVFAVGYIKISWS 100 110 120 130 140 150 350 360 370 380 390 400 pF1KE6 LLGELALVVFSVVNAGSLFLMHYTANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVER ::..: .::.. :.....: ..:::.:::.:..:. ::::::::.::::.::..:: CCDS81 TWGEMTLSLFSLLIAAAVYIMDTVGNIWVCYASYVVFRIIYMLLITIATFQIAANLSMER 160 170 180 190 200 210 410 420 430 440 450 460 pF1KE6 YALVFGINTFIALVIQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMR-SMYIT ::::::.::::::..::..:.:::: ::.: .. :::.:.::::.:: .:: .. . CCDS81 YALVFGVNTFIALALQTLLTLIVVDASGLGLEITTQFLIYASYFALIAVVFLASGAVSVM 220 230 240 250 260 270 470 480 490 pF1KE6 YSTKSQKDVQSPAPSENPDVSHPEEESNIIMSTKL . .. .: :: CCDS81 KKCRKLEDPQSSSQVTTS 280 290 >>CCDS56218.1 SLC19A1 gene_id:6573|Hs108|chr21 (489 aa) initn: 1172 init1: 679 opt: 682 Z-score: 841.0 bits: 165.1 E(32554): 1.6e-40 Smith-Waterman score: 1159; 43.1% identity (73.1% similar) in 432 aa overlap (11-438:24-431) 10 20 30 40 pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLT :: . . ::..::....::.: :. ::: :::::.: CCDS56 MVPSSPAVEKQVPVEPGPDPELRSWRHLVCYLCFYGFMAQIRPGESFITPYLLGPDKNFT 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE6 SAEITNEIFPVWTYSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQ ..:::: :: .::::..:.:::.::::.:: ::..:::.::. .:::::.:..: :: CCDS56 REQVTNEITPVLSYSYLAVLVPVFLLTDYLRYTPVLLLQGLSFVSVWLLLLLGHSVAHMQ 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE6 VVEFFYGMVTAAEVAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANM ..:.::... ::..:: .::.:.: : .::::.:: :...: . ..:::.::::... . CCDS56 LMELFYSVTMAARIAYSSYIFSLVRPARYQRVAGYSRAAVLLGVFTSSVLGQLLVTVGRV 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE6 SYFYLNVISLASVSVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPG :. :: :::: .. . ...::: ::.:.::. . . :.: ::. . : :: CCDS56 SFSTLNYISLAFLTFSVVLALFLKRPKRSLFFNRDDRGRCETSASE---LERMNPG--PG 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 CEEQKPTSEILSTSGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAF :::... . : :... ...: . .: :::::.: CCDS56 --------------GKLGHALRVACGDS-----VLARMLRELGDSLRRPQLRLWSLWWVF 240 250 260 270 290 300 310 320 330 340 pF1KE6 ATAGFNQVLNYVQILWDYKAPSQDSS-IYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGE .::. :. ::.:::. :. .:. .::::..: .:. ::...::.:.::. : .. CCDS56 NSAGYYLVVYYVHILWNEVDPTTNSARVYNGAADAASTLLGAITSFAAGFVKIRWARWSK 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE6 LALVVFSVVNAGSLFLMHYT---ANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERY : .. ....:: .::. .: ..:: :::....:..::..:. ::.:::: .:. : CCDS56 LLIAGVTATQAGLVFLLAHTRHPSSIWLCYAAFVLFRGSYQFLVPIATFQIASSLSKELC 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE6 ALVFGINTFIALVIQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMYITYS :::::.:::.: ...::.: :: : :::.::: : CCDS56 ALVFGVNTFFATIVKTIITFIVSDVRGLGLPVRKQNEELHVASLSLWKSHLRLAADTLSS 400 410 420 430 440 450 470 480 490 pF1KE6 TKSQKDVQSPAPSENPDVSHPEEESNIIMSTKL CCDS56 EGSSGSGPRSWFLSPTLRAALHGPVCPSEVCPS 460 470 480 >>CCDS13725.1 SLC19A1 gene_id:6573|Hs108|chr21 (591 aa) initn: 1219 init1: 678 opt: 682 Z-score: 839.9 bits: 165.1 E(32554): 1.8e-40 Smith-Waterman score: 1214; 41.5% identity (72.3% similar) in 470 aa overlap (11-474:24-469) 10 20 30 40 pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLT :: . . ::..::....::.: :. ::: :::::.: CCDS13 MVPSSPAVEKQVPVEPGPDPELRSWRHLVCYLCFYGFMAQIRPGESFITPYLLGPDKNFT 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE6 SAEITNEIFPVWTYSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQ ..:::: :: .::::..:.:::.::::.:: ::..:::.::. .:::::.:..: :: CCDS13 REQVTNEITPVLSYSYLAVLVPVFLLTDYLRYTPVLLLQGLSFVSVWLLLLLGHSVAHMQ 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE6 VVEFFYGMVTAAEVAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANM ..:.::... ::..:: .::.:.: : .::::.:: :...: . ..:::.::::... . CCDS13 LMELFYSVTMAARIAYSSYIFSLVRPARYQRVAGYSRAAVLLGVFTSSVLGQLLVTVGRV 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE6 SYFYLNVISLASVSVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPG :. :: :::: .. . ...::: ::.:.::. . . :.: ::. . : :: CCDS13 SFSTLNYISLAFLTFSVVLALFLKRPKRSLFFNRDDRGRCETSASE---LERMNPG--PG 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 CEEQKPTSEILSTSGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAF :::... . : :... ...: . .: :::::.: CCDS13 --------------GKLGHALRVACGDS-----VLARMLRELGDSLRRPQLRLWSLWWVF 240 250 260 270 290 300 310 320 330 340 pF1KE6 ATAGFNQVLNYVQILWDYKAPSQDSS-IYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGE .::. :. ::.:::. :. .:. .::::..: .:. ::...::.:.::. : .. CCDS13 NSAGYYLVVYYVHILWNEVDPTTNSARVYNGAADAASTLLGAITSFAAGFVKIRWARWSK 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE6 LALVVFSVVNAGSLFLMHYT---ANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERY : .. ....:: .::. .: ..:: :::....:..::..:. ::.:::: .:. : CCDS13 LLIAGVTATQAGLVFLLAHTRHPSSIWLCYAAFVLFRGSYQFLVPIATFQIASSLSKELC 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE6 ALVFGINTFIALVIQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMY--IT :::::.:::.: ...::.: :: : :::.::: :: .:. :: ... :... .: . CCDS13 ALVFGVNTFFATIVKTIITFIVSDVRGLGLPVRKQFQLYSVYFLILSIIYFLGAMLDGLR 400 410 420 430 440 450 470 480 490 pF1KE6 YSTKSQKDVQSPAPSENPDVSHPEEESNIIMSTKL . .... : :: CCDS13 HCQRGHHPRQPPAQGLRSAAEEKAAQALSVQDKGLGGLQPAQSPPLSPEDSLGAVGPASL 460 470 480 490 500 510 >>CCDS56217.1 SLC19A1 gene_id:6573|Hs108|chr21 (551 aa) initn: 1092 init1: 551 opt: 555 Z-score: 683.6 bits: 136.1 E(32554): 9.3e-32 Smith-Waterman score: 1087; 40.2% identity (70.2% similar) in 453 aa overlap (28-474:1-429) 10 20 30 40 50 60 pF1KE6 MDCYRTSLSSSWIYPTVILCLFGFFSMMRPSEPFLIPYLSGPDKNLTSAEITNEIFPVWT :::. : : . .:.:::: :: . CCDS56 MRPQPAEPAPGGRGNEACSIHSEVTNEITPVLS 10 20 30 70 80 90 100 110 120 pF1KE6 YSYLVLLLPVFVLTDYVRYKPVIILQGISFIITWLLLLFGQGVKTMQVVEFFYGMVTAAE ::::..:.:::.::::.:: ::..:::.::. .:::::.:..: ::..:.::... ::. CCDS56 YSYLAVLVPVFLLTDYLRYTPVLLLQGLSFVSVWLLLLLGHSVAHMQLMELFYSVTMAAR 40 50 60 70 80 90 130 140 150 160 170 180 pF1KE6 VAYYAYIYSVVSPEHYQRVSGYCRSVTLAAYTAGSVLAQLLVSLANMSYFYLNVISLASV .:: .::.:.: : .::::.:: :...: . ..:::.::::... .:. :: :::: . CCDS56 IAYSSYIFSLVRPARYQRVAGYSRAAVLLGVFTSSVLGQLLVTVGRVSFSTLNYISLAFL 100 110 120 130 140 150 190 200 210 220 230 240 pF1KE6 SVAFLFSLFLPMPKKSMFFHAKPSREIKKSSSVNPVLEETHEGEAPGCEEQKPTSEILST . . ...::: ::.:.::. . . :.: ::. . : :: CCDS56 TFSVVLALFLKRPKRSLFFNRDDRGRCETSAS---ELERMNPG--PG------------- 160 170 180 190 250 260 270 280 290 300 pF1KE6 SGKLNKGQLNSLKPSNVTVDVFVQWFQDLKECYSSKRLFYWSLWWAFATAGFNQVLNYVQ :::... . : :... ...: . .: :::::.: .::. :. ::. CCDS56 -GKLGHALRVACGDS-----VLARMLRELGDSLRRPQLRLWSLWWVFNSAGYYLVVYYVH 200 210 220 230 240 310 320 330 340 350 pF1KE6 ILWDYKAPSQDSS-IYNGAVEAIATFGGAVAAFAVGYVKVNWDLLGELALVVFSVVNAGS :::. :. .:. .::::..: .:. ::...::.:.::. : ..: .. ....:: CCDS56 ILWNEVDPTTNSARVYNGAADAASTLLGAITSFAAGFVKIRWARWSKLLIAGVTATQAGL 250 260 270 280 290 300 360 370 380 390 400 410 pF1KE6 LFLMHYT---ANIWACYAGYLIFKSSYMLLITIAVFQIAVNLNVERYALVFGINTFIALV .::. .: ..:: :::....:..::..:. ::.:::: .:. : :::::.:::.: . CCDS56 VFLLAHTRHPSSIWLCYAAFVLFRGSYQFLVPIATFQIASSLSKELCALVFGVNTFFATI 310 320 330 340 350 360 420 430 440 450 460 470 pF1KE6 IQTIMTVIVVDQRGLNLPVSIQFLVYGSYFAVIAGIFLMRSMY--ITYSTKSQKDVQSPA ..::.: :: : :::.::: :: .:. :: ... :... .: . . .... : :: CCDS56 VKTIITFIVSDVRGLGLPVRKQFQLYSVYFLILSIIYFLGAMLDGLRHCQRGHHPRQPPA 370 380 390 400 410 420 480 490 pF1KE6 PSENPDVSHPEEESNIIMSTKL CCDS56 QGLRSAAEEKAAQALSVQDKGLGGLQPAQSPPLSPEDSLGAVGPASLEQRQSDPYLAQAP 430 440 450 460 470 480 496 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:58:33 2016 done: Tue Nov 8 12:58:34 2016 Total Scan time: 1.980 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]