FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6396, 438 aa 1>>>pF1KE6396 438 - 438 aa - 438 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3081+/-0.00109; mu= 17.4255+/- 0.065 mean_var=63.8084+/-13.123, 0's: 0 Z-trim(102.7): 36 B-trim: 857 in 2/50 Lambda= 0.160559 statistics sampled from 7055 (7068) to 7055 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.576), E-opt: 0.2 (0.217), width: 16 Scan time: 2.020 The best scores are: opt bits E(32554) CCDS34915.1 SLC10A5 gene_id:347051|Hs108|chr8 ( 438) 2782 653.5 1.2e-187 CCDS14755.1 SLC10A3 gene_id:8273|Hs108|chrX ( 477) 983 236.8 3.6e-62 CCDS48195.1 SLC10A3 gene_id:8273|Hs108|chrX ( 448) 926 223.6 3.2e-58 CCDS9506.1 SLC10A2 gene_id:6555|Hs108|chr13 ( 348) 530 131.8 1.1e-30 CCDS3482.1 SLC10A4 gene_id:201780|Hs108|chr4 ( 437) 467 117.2 3.2e-26 CCDS3614.1 SLC10A6 gene_id:345274|Hs108|chr4 ( 377) 445 112.1 9.5e-25 CCDS9797.1 SLC10A1 gene_id:6554|Hs108|chr14 ( 349) 410 104.0 2.5e-22 >>CCDS34915.1 SLC10A5 gene_id:347051|Hs108|chr8 (438 aa) initn: 2782 init1: 2782 opt: 2782 Z-score: 3482.4 bits: 653.5 E(32554): 1.2e-187 Smith-Waterman score: 2782; 100.0% identity (100.0% similar) in 438 aa overlap (1-438:1-438) 10 20 30 40 50 60 pF1KE6 MIRKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYENKRPNSSHL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MIRKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYENKRPNSSHL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 FVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 FVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIKN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 VKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWKRPLPVILG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 VKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWKRPLPVILG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 AVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAILMTC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAILMTC 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 TSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRIPEKAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRIPEKAS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 FLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFAKVCTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 FLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFAKVCTL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 PLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIILVYKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 PLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIILVYKA 370 380 390 400 410 420 430 pF1KE6 KKRCIFFLQDKRKRNFLI :::::::::::::::::: CCDS34 KKRCIFFLQDKRKRNFLI 430 >>CCDS14755.1 SLC10A3 gene_id:8273|Hs108|chrX (477 aa) initn: 983 init1: 888 opt: 983 Z-score: 1229.7 bits: 236.8 E(32554): 3.6e-62 Smith-Waterman score: 983; 39.9% identity (72.1% similar) in 391 aa overlap (33-416:75-465) 10 20 30 40 50 pF1KE6 RKLFIVLLLLLVTIEEARMSSLSFLNIEKTEILFFTKTEETILVSSSYE---NKRPNSSH :. : .: :..::.: :. . CCDS14 TASTSLSTAGGHTVPPTGGRYLSIGDGSVMEFEFPEDSEGIIVISSQYPGQANRTAPGPM 50 60 70 80 90 100 60 70 80 90 100 110 pF1KE6 LFVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIK : : : ..: . ::. . . .:.... . : . . ::: :.. :::: . CCDS14 LRVTSLDTEVLTIKNVSAITWGGGGGFVVSIHSGLAGLAPLHIQLVDAHEAPPTLIEERR 110 120 130 140 150 160 120 130 140 150 160 170 pF1KE6 NVKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPL . .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : CCDS14 DFCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQ 170 180 190 200 210 220 180 190 200 210 220 230 pF1KE6 PVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLA :..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: ::: CCDS14 PMLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLA 230 240 250 260 270 280 240 250 260 270 280 290 pF1KE6 ILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRI : :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: .. CCDS14 ISMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKL 290 300 310 320 330 340 300 310 320 330 340 350 pF1KE6 PEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFA :. ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: CCDS14 PKFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLA 350 360 370 380 390 400 360 370 380 390 400 410 pF1KE6 KVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLII ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: .. CCDS14 TCLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALV 410 420 430 440 450 460 420 430 pF1KE6 LVYKAKKRCIFFLQDKRKRNFLI . CCDS14 IGHFIYSSLFPVP 470 >>CCDS48195.1 SLC10A3 gene_id:8273|Hs108|chrX (448 aa) initn: 968 init1: 888 opt: 926 Z-score: 1158.8 bits: 223.6 E(32554): 3.2e-58 Smith-Waterman score: 926; 42.7% identity (76.1% similar) in 330 aa overlap (91-416:107-436) 70 80 90 100 110 120 pF1KE6 FVKIEDPKILQMVNVAKKISSDATNFTINLVTDEEGETNVTIQLWDSEGRQERLIEEIKN ::. . :. . .: :.. :::: .. CCDS48 EFPEDSEGIIVISSQYPGQANRTAPGPMLRVTSLDTEVLTIKNLVDAHEAPPTLIEERRD 80 90 100 110 120 130 130 140 150 160 170 pF1KE6 VKVKVLKQKDS--LLQAPM-HIDRN-ILMLILPLILLNKCAFGCKIELQLFQTVWKRPLP .:: .:. :.: . :...: ::.:.::::..:::.::::.::.... . . : : CCDS48 FCIKVSPAEDTPATLSADLAHFSENPILYLLLPLIFVNKCSFGCKVELEVLKGLMQSPQP 140 150 160 170 180 190 180 190 200 210 220 230 pF1KE6 VILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAI ..:: . ::..::. .::.... ::.: :.:...::. :::::.:::.::: :: :::: CCDS48 MLLGLLGQFLVMPLYAFLMAKVFMLPKALALGLIITCSSPGGGGSYLFSLLLGGDVTLAI 200 210 220 230 240 250 240 250 260 270 280 290 pF1KE6 LMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIKHRIP :: ::. : ..:..: ::::.:.. :.:.:.:::..::::: .:...:..:: ..: CCDS48 SMTFLSTVAATGFLPLSSAIYSRLLSIHETLHVPISKILGTLLFIAIPIAVGVLIKSKLP 260 270 280 290 300 310 300 310 320 330 340 350 pF1KE6 EKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNLEVILLGLLVPALGLLFGYSFAK . ...: ....:.::.:.. :..:.. .:. .: : ..:.:. :: .::: :: .: CCDS48 KFSQLLLQVVKPFSFVLLLGGLFLAYRMGVFILAGIRLPIVLVGITVPLVGLLVGYCLAT 320 330 340 350 360 370 360 370 380 390 400 410 pF1KE6 VCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIIL ::. .::.:: :. ::.::::..:::. . .:. :: ::: ::. . ::: ... CCDS48 CLKLPVAQRRTVSIEVGVQNSLLALAMLQLSLRRLQADYASQAPFIVALSGTSEMLALVI 380 390 400 410 420 430 420 430 pF1KE6 VYKAKKRCIFFLQDKRKRNFLI CCDS48 GHFIYSSLFPVP 440 >>CCDS9506.1 SLC10A2 gene_id:6555|Hs108|chr13 (348 aa) initn: 456 init1: 368 opt: 530 Z-score: 664.7 bits: 131.8 E(32554): 1.1e-30 Smith-Waterman score: 530; 32.6% identity (63.2% similar) in 285 aa overlap (143-424:37-314) 120 130 140 150 160 170 pF1KE6 RLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWK .: ..: :.... .::..:.. : : CCDS95 CVDNATVCSGASCVVPESNFNNILSVVLSTVLTILLALVMFS---MGCNVEIKKFLGHIK 10 20 30 40 50 60 180 190 200 210 220 230 pF1KE6 RPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDF :: . .: . :: .::. ::.:: . :: :.. :::: .. ..: .:::. CCDS95 RPWGICVGFLCQFGIMPLTGFILSVAFDILPLQAVVVLIIGCCPGGTASNILAYWVDGDM 70 80 90 100 110 120 240 250 260 270 280 290 pF1KE6 TLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVPVSIGIVIK :.. :: :::::: :::. ::... ::.. :: ..: ..:. ..::::::. .. CCDS95 DLSVSMTTCSTLLALGMMPLCLLIYTKMWVDSGSIVIPYDNIGTSLVSLVVPVSIGMFVN 130 140 150 160 170 180 300 310 320 330 340 pF1KE6 HRIPEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTDNL---EVILLGLLVPALGLL :. :.:: .:: .. : . : : .:: .. .. . .. ..: . :. : CCDS95 HKWPQKA----KIILKIGSIAGAILIVLIAVVGGILYQSAWIIAPKLWIIGTIFPVAGYS 190 200 210 220 230 350 360 370 380 390 400 pF1KE6 FGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGC .:. .:.. :: :.:::.:.:: :. : ...:::: . :.. . :. .. . CCDS95 LGFLLARIAGLPWYRCRTVAFETGMQNTQLCSTIVQLSFTPEELNVVFTFPLIYSIFQLA 240 250 260 270 280 290 410 420 430 pF1KE6 EMLLIILVYKAKKRCIFFLQDKRKRNFLI ... : : :.: CCDS95 FAAIFLGFYVAYKKCHGKNKAEIPESKENGTEPESSFYKANGGFQPDEK 300 310 320 330 340 >>CCDS3482.1 SLC10A4 gene_id:201780|Hs108|chr4 (437 aa) initn: 389 init1: 283 opt: 467 Z-score: 584.3 bits: 117.2 E(32554): 3.2e-26 Smith-Waterman score: 467; 31.3% identity (64.9% similar) in 265 aa overlap (158-419:120-383) 130 140 150 160 170 180 pF1KE6 QKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQTVWKRPLPVILGAVTQFFL .:: .... : . .::. ..:.:. :: : CCDS34 APHALPFWDTPLNHGLNVFVGAALCITMLGLGCTVDVNHFGAHVRRPVGALLAALCQFGL 90 100 110 120 130 140 190 200 210 220 230 240 pF1KE6 MPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLFALLLDGDFTLAILMTCTSTLLAL .:. .:::. : :. : .:.. ::::. . :..::.:::..:.:.:: .:::::: CCDS34 LPLLAFLLALAFKLDEVAAVAVLLCGCCPGGNLSNLMSLLVDGDMNLSIIMTISSTLLAL 150 160 170 180 190 200 250 260 270 280 290 300 pF1KE6 IMMPVNSYIYSRILGLSGTFHI-PVSKIVSTLLFILVPVSIGIVIKHRIPEKASFLERII ..::. .::: . .. :.. .. :: :.:...:. :... . :... .. CCDS34 VLMPLCLWIYSWAWINTPIVQLLPLGTVTLTLCSTLIPIGLGVFIRYKYSRVADYIVKVS 210 220 230 240 250 260 310 320 330 340 350 360 pF1KE6 RPLSFILMFVGIYLTFTV-GLVFLKTDNLEVILLGLLVPALGLLFGYSFAKVCTLPLPVC .. . : . .: :. : .: . : ......: : ::..: . :: : : CCDS34 LWSLLVTLVVLFIMTGTMLGPELLASIPAAVYVIAIFMPLAGYASGYGLATLFHLP-PNC 270 280 290 300 310 320 370 380 390 400 410 420 pF1KE6 K-TVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVAMCSGCEMLLIILVYKAKKRC : :: .:.: : : :...:.:: . . . :. :. .. : ...:.:: CCDS34 KRTVCLETGSQNVQLCTAILKLAFPPQFIGSMYMFPLLYALFQSAEAGIFVLIYKMYGSE 330 340 350 360 370 380 430 pF1KE6 IFFLQDKRKRNFLI CCDS34 MLHKRDPLDEDEDTDISYKKLKEEEMADTSYGTVKAENIIMMETAQTSL 390 400 410 420 430 >>CCDS3614.1 SLC10A6 gene_id:345274|Hs108|chr4 (377 aa) initn: 371 init1: 334 opt: 445 Z-score: 557.8 bits: 112.1 E(32554): 9.5e-25 Smith-Waterman score: 445; 27.4% identity (63.7% similar) in 292 aa overlap (137-423:26-313) 110 120 130 140 150 160 pF1KE6 SEGRQERLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAF--GCKIEL .: . .... .. .... : ::..:. CCDS36 MRANCSSSSACPANSSEEELPVGLEVHGNLELVFTVVSTVMMGLLMFSLGCSVEI 10 20 30 40 50 170 180 190 200 210 220 pF1KE6 QLFQTVWKRPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTCPGGGGGYLF . . . .:: . .: . :: :::: ..::. .: .::..:.. :::: . .: CCDS36 RKLWSHIRRPWGIAVGLLCQFGLMPFTAYLLAISFSLKPVQAIAVLIMGCCPGGTISNIF 60 70 80 90 100 110 230 240 250 260 270 280 pF1KE6 ALLLDGDFTLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFHIPVSKIVSTLLFILVP .. .:::. :.: :: ::. :: :::. :.:. .:. .. :: ..: ::. . .: CCDS36 TFWVDGDMDLSISMTTCSTVAALGMMPLCIYLYTWSWSLQQNLTIPYQNIGITLVCLTIP 120 130 140 150 160 170 290 300 310 320 330 340 pF1KE6 VSIGIVIKHRIPEKASFLERIIRPLSFILMFVGIYLTFTVGLVFLKTD-NLEVILL--GL :..:. ...: :...... .: .. .:..: . ..:.:. : . : .. :: .. CCDS36 VAFGVYVNYRWPKQSKIILKIGAVVGGVLLLV----VAVAGVVLAKGSWNSDITLLTISF 180 190 200 210 220 230 350 360 370 380 390 400 pF1KE6 LVPALGLLFGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPF . : .: . :. .: :.:...:.: : . ....:::: . :. CCDS36 IFPLIGHVTGFLLALFTHQSWQRCRTISLETGAQNIQMCITMLQLSFTAEHLVQMLSFPL 240 250 260 270 280 290 410 420 430 pF1KE6 TVAMCSGCEMLLIILVYKAKKRCIFFLQDKRKRNFLI . .. . . .::. .:.. :: CCDS36 AYGLFQLIDGFLIVAAYQTYKRRLKNKHGKKNSGCTEVCHTRKSTSSRETNAFLEVNEEG 300 310 320 330 340 350 >>CCDS9797.1 SLC10A1 gene_id:6554|Hs108|chr14 (349 aa) initn: 382 init1: 227 opt: 410 Z-score: 514.5 bits: 104.0 E(32554): 2.5e-22 Smith-Waterman score: 410; 29.2% identity (65.5% similar) in 284 aa overlap (143-418:30-304) 120 130 140 150 160 170 pF1KE6 RLIEEIKNVKVKVLKQKDSLLQAPMHIDRNILMLILPLILLNKCAFGCKIELQLFQT-VW ::...: .:.:. .:: .:.. ... .: CCDS97 MEAHNASAPFNFTLPPNFGKRPTDLALSVILVFMLFFIMLS---LGCTMEFSKIKAHLW 10 20 30 40 50 180 190 200 210 220 230 pF1KE6 KRPLPVILGAVTQFFLMPFCGFLLSQIVALPEAQAFGVVMTCTC-PGGGGGYLFALLLDG : : . .. :.:. .::. .:.:... : . .:... ..: : :::. . .:.: . : CCDS97 K-PKGLAIALVAQYGIMPLTAFVLGKVFRLKNIEALAI-LVCGCSPGGNLSNVFSLAMKG 60 70 80 90 100 110 240 250 260 270 280 pF1KE6 DFTLAILMTCTSTLLALIMMPVNSYIYSRILGLSGTFH--IPVSKIVSTLLFILVPVSIG :..:.:.:: ::. :: :::. ::::: . .: .. .: . :: .:...:.: .:: CCDS97 DMNLSIVMTTCSTFCALGMMPLLLYIYSRGI-YDGDLKDKVPYKGIVISLVLVLIPCTIG 120 130 140 150 160 170 290 300 310 320 330 340 pF1KE6 IVIKHRIPEKASFLERIIRPLSFILMFVGIYLT----FTVGLVFLKTDNLEVILLGLLVP ::.: . :. ... .:. .:... .. .: ..:: .. . . .: . :.: CCDS97 IVLKSKRPQ---YMRYVIKGGMIIILLCSVAVTVLSAINVGKSIMFAMTPLLIATSSLMP 180 190 200 210 220 230 350 360 370 380 390 400 pF1KE6 ALGLLFGYSFAKVCTLPLPVCKTVAIESGMLNSFLALAVIQLSFPQSKANLASVAPFTVA .:.:.:: .. . : .::..:.: : : ......:: . :. CCDS97 FIGFLLGYVLSALFCLNGRCRRTVSMETGCQNVQLCSTILNVAFPPEVIGPLFFFPLLYM 240 250 260 270 280 290 410 420 430 pF1KE6 MCSGCEMLLIILVYKAKKRCIFFLQDKRKRNFLI . . : ::.: .. CCDS97 IFQLGEGLLLIAIFWCYEKFKTPKDKTKMIYTAATTEETIPGALGNGTYKGEDCSPCTA 300 310 320 330 340 438 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 12:54:18 2016 done: Tue Nov 8 12:54:19 2016 Total Scan time: 2.020 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]