FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4439, 456 aa 1>>>pF1KE4439 456 - 456 aa - 456 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4132+/-0.000966; mu= 16.8912+/- 0.058 mean_var=61.7593+/-12.661, 0's: 0 Z-trim(104.3): 33 B-trim: 0 in 0/48 Lambda= 0.163201 statistics sampled from 7829 (7843) to 7829 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.604), E-opt: 0.2 (0.241), width: 16 Scan time: 3.060 The best scores are: opt bits E(32554) CCDS4908.1 SLC29A1 gene_id:2030|Hs108|chr6 ( 456) 2969 707.8 5.7e-204 CCDS7310.1 SLC29A3 gene_id:55315|Hs108|chr10 ( 475) 773 190.8 2.6e-48 CCDS8137.1 SLC29A2 gene_id:3177|Hs108|chr11 ( 456) 625 155.9 7.8e-38 CCDS73326.1 SLC29A2 gene_id:3177|Hs108|chr11 ( 361) 620 154.7 1.4e-37 CCDS5340.1 SLC29A4 gene_id:222962|Hs108|chr7 ( 530) 263 70.7 4e-12 >>CCDS4908.1 SLC29A1 gene_id:2030|Hs108|chr6 (456 aa) initn: 2969 init1: 2969 opt: 2969 Z-score: 3775.4 bits: 707.8 E(32554): 5.7e-204 Smith-Waterman score: 2969; 100.0% identity (100.0% similar) in 456 aa overlap (1-456:1-456) 10 20 30 40 50 60 pF1KE4 MTTSHQPQDRYKAVWLIFFMLGLGTLLPWNFFMTATQYFTNRLDMSQNVSLVTAELSKDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 MTTSHQPQDRYKAVWLIFFMLGLGTLLPWNFFMTATQYFTNRLDMSQNVSLVTAELSKDA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 QASAAPAAPLPERNSLSAIFNNVMTLCAMLPLLLFTYLNSFLHQRIPQSVRILGSLVAIL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 QASAAPAAPLPERNSLSAIFNNVMTLCAMLPLLLFTYLNSFLHQRIPQSVRILGSLVAIL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 LVFLITAILVKVQLDALPFFVITMIKIVLINSFGAILQGSLFGLAGLLPASYTAPIMSGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 LVFLITAILVKVQLDALPFFVITMIKIVLINSFGAILQGSLFGLAGLLPASYTAPIMSGQ 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 GLAGFFASVAMICAIASGSELSESAFGYFITACAVIILTIICYLGLPRLEFYRYYQQLKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 GLAGFFASVAMICAIASGSELSESAFGYFITACAVIILTIICYLGLPRLEFYRYYQQLKL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 EGPGEQETKLDLISKGEEPRAGKEESGVSVSNSQPTNESHSIKAILKNISVLAFSVCFIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 EGPGEQETKLDLISKGEEPRAGKEESGVSVSNSQPTNESHSIKAILKNISVLAFSVCFIF 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 TITIGMFPAVTVEVKSSIAGSSTWERYFIPVSCFLTFNIFDWLGRSLTAVFMWPGKDSRW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 TITIGMFPAVTVEVKSSIAGSSTWERYFIPVSCFLTFNIFDWLGRSLTAVFMWPGKDSRW 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 LPSLVLARLVFVPLLLLCNIKPRRYLTVVFEHDAWFIFFMAAFAFSNGYLASLCMCFGPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS49 LPSLVLARLVFVPLLLLCNIKPRRYLTVVFEHDAWFIFFMAAFAFSNGYLASLCMCFGPK 370 380 390 400 410 420 430 440 450 pF1KE4 KVKPAEAETAGAIMAFFLCLGLALGAVFSFLFRAIV :::::::::::::::::::::::::::::::::::: CCDS49 KVKPAEAETAGAIMAFFLCLGLALGAVFSFLFRAIV 430 440 450 >>CCDS7310.1 SLC29A3 gene_id:55315|Hs108|chr10 (475 aa) initn: 819 init1: 209 opt: 773 Z-score: 980.8 bits: 190.8 E(32554): 2.6e-48 Smith-Waterman score: 890; 33.0% identity (67.5% similar) in 458 aa overlap (5-456:44-475) 10 20 30 pF1KE4 MTTSHQPQDRYKAVWLIFFMLGLGTLLPWNFFMT ..:.::. ....::: ::.:.:::::::.: CCDS73 NSTYRTTSSSLRADQEALLEKLLDRPPPGLQRPEDRFCGTYIIFFSLGIGSLLPWNFFIT 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE4 ATQYFTNRLDMSQNVSLVTAELSKDAQASAAPAAPL-PERNSLSAIFNNVMTLCAMLPLL : .:. .: . :..::. :: ... :.. ... . .: . CCDS73 AKEYWMFKL-----------------RNSSSPATGEDPEGSDILNYFESYLAVASTVPSM 80 90 100 110 100 110 120 130 140 150 pF1KE4 LFTYLNSFLHQRIPQSVRILGSLVAILLVFLITAILVKVQLDALP--FFVITMIKIVLIN : : .: .:. .:.:.::..:: .:.. . ::::. .. ::..:.. .:... CCDS73 LCLVANFLLVNRVAVHIRVLASLTVILAIFMVITALVKVDTSSWTRGFFAVTIVCMVILS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE4 SFGAILQGSLFGLAGLLPASYTAPIMSGQGLAGFFASVAMICAIASGSELSESAFGYFIT . ......:..:..: .: . ..:: ...: ..:: . .:..:.. .::...:.: CCDS73 GASTVFSSSIYGMTGSFPMRNSQALISGGAMGGTVSAVASLVDLAASSDVRNSALAFFLT 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE4 ACAVIILTIICYLGLPRLEFYRYYQQLKLEGPGEQETKLDLISKGEEPRAGKEESGVSVS : . ..: . :: : :::. :::.. : . . .::: :. ::. CCDS73 ATVFLVLCMGLYLLLSRLEYARYYMRPVLAAH---------VFSGEEELPQDSLSAPSVA 240 250 260 270 280 280 290 300 310 320 pF1KE4 NSQPTNESHSIKAILKNISVLAFSVCFIFTITIGMFPAVTVEVKSSIAGS-STWE-RYFI . ... .. :::. . :.: : ..: :: ..::. ....: :: : : ..:: CCDS73 SRFIDSHTPPLRPILKKTASLGFCVTYVFFITSLIYPAICTNIESLNKGSGSLWTTKFFI 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE4 PVSCFLTFNIFDWLGRSLTAVFMWPGKDSRWLPSLVLARLVFVPLLLLCNIKPRRYL-TV :.. :: .:. : ::.::: .. :: .:. ::..:: : ..::..::: .:: .: :: CCDS73 PLTTFLLYNFADLCGRQLTAWIQVPGPNSKALPGFVLLRTCLIPLFVLCNYQPRVHLKTV 350 360 370 380 390 400 390 400 410 420 430 440 pF1KE4 VFEHDAWFIFFMAAFAFSNGYLASLCMCFGPKKVKPAEAETAGAIMAFFLCLGLALGAVF ::. :.. .. . ...:::::..: . .::: : ::..:..:.:..::::.::.. CCDS73 VFQSDVYPALLSSLLGLSNGYLSTLALLYGPKIVPRELAEATGVVMSFYVCLGLTLGSAC 410 420 430 440 450 460 450 pF1KE4 SFLFRAIV : :. .. CCDS73 STLLVHLI 470 >>CCDS8137.1 SLC29A2 gene_id:3177|Hs108|chr11 (456 aa) initn: 1238 init1: 616 opt: 625 Z-score: 792.7 bits: 155.9 E(32554): 7.8e-38 Smith-Waterman score: 1358; 47.1% identity (73.0% similar) in 471 aa overlap (1-456:1-456) 10 20 30 40 50 60 pF1KE4 MTTSHQPQDRYKAVWLIFFMLGLGTLLPWNFFMTATQYFTNRLDMSQNVSLVTAELSKDA :. . :.: :. : . ::.::::::::::::.:: :: :: . : ::.. CCDS81 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGNS---TARI---- 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 QASAAPAAPLPERNSLSAIFNNVMTLCAMLPLLLFTYLNSFLHQRIPQSVRILGSLVAIL :. ..: : ::: .:: ..::::::: :::::.: .:..:::::::.::: CCDS81 -LSTNHTGPEDAFN-----FNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAIL 60 70 80 90 100 130 140 150 160 170 180 pF1KE4 LVFLITAILVKVQLDALPFFVITMIKIVLINSFGAILQGSLFGLAGLLPASYTAPIMSGQ :.: .:: ::::... ::: ::: .. .::::.:.::::::: : .:..:.. ..::: CCDS81 LLFALTAALVKVDMSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQ 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE4 GLAGFFASVAMICAIASGSELSESAFGYFITACAVIILTIICYLGLPRLEFYRYYQQLKL ::::.::..::. ..::: . ::.::::: :. :...:.:::.::.:.: ::: : CCDS81 GLAGIFAALAMLLSMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKS 170 180 190 200 210 220 250 260 270 280 pF1KE4 EGPGEQE--TKLDLISKGEE--PRAGKEESGVSVS---NSQPTNESH--------SIKAI :: :: .:... :. : .. .. ..... ...: .: :. .. CCDS81 SQAQAQELETKAELLQSDENGIP-SSPQKVALTLDLDLEKEPESEPDEPQKPGKPSVFTV 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 LKNISVLAFSVCFIFTITIGMFPAVTVEVKSSIAGSSTWERYFIPVSCFLTFNIFDWLGR ...: . :. . ..::.:...:::.:. : :: .. . : ..: :. ::: :::.::::: CCDS81 FQKIWLTALCLVLVFTVTLSVFPAITAMVTSS-TSPGKWSQFFNPICCFLLFNIMDWLGR 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE4 SLTAVFMWPGKDSRWLPSLVLARLVFVPLLLLCNIKPRRYLTVVFEHDAWFIFFMAAFAF :::. :.:: .::: :: :: :..::::..::.. : : ..: .::.:: :: :: CCDS81 SLTSYFLWPDEDSRLLPLLVCLRFLFVPLFMLCHVPQRSRLPILFPQDAYFITFMLLFAV 350 360 370 380 390 400 410 420 430 440 450 pF1KE4 SNGYLASLCMCFGPKKVKPAEAETAGAIMAFFLCLGLALGAVFSFLFRAIV :::::.:: ::..:..: : : :.:::.:.::: :::. :: .::::.:.. CCDS81 SNGYLVSLTMCLAPRQVLPHEREVAGALMTFFLALGLSCGASLSFLFKALL 410 420 430 440 450 >>CCDS73326.1 SLC29A2 gene_id:3177|Hs108|chr11 (361 aa) initn: 775 init1: 616 opt: 620 Z-score: 788.0 bits: 154.7 E(32554): 1.4e-37 Smith-Waterman score: 756; 50.6% identity (72.5% similar) in 255 aa overlap (1-253:1-242) 10 20 30 40 50 60 pF1KE4 MTTSHQPQDRYKAVWLIFFMLGLGTLLPWNFFMTATQYFTNRLDMSQNVSLVTAELSKDA :. . :.: :. : . ::.::::::::::::.:: :: :: . : ::.. CCDS73 MARGDAPRDSYHLVGISFFILGLGTLLPWNFFITAIPYFQARLAGAGN---STARI---- 10 20 30 40 50 70 80 90 100 110 120 pF1KE4 QASAAPAAPLPERNSLSAIFNNVMTLCAMLPLLLFTYLNSFLHQRIPQSVRILGSLVAIL :. ..: : ::: .:: ..::::::: :::::.: .:..:::::::.::: CCDS73 -LSTNHTGPEDAFN-----FNNWVTLLSQLPLLLFTLLNSFLYQCVPETVRILGSLLAIL 60 70 80 90 100 130 140 150 160 170 180 pF1KE4 LVFLITAILVKVQLDALPFFVITMIKIVLINSFGAILQGSLFGLAGLLPASYTAPIMSGQ :.: .:: ::::... ::: ::: .. .::::.:.::::::: : .:..:.. ..::: CCDS73 LLFALTAALVKVDMSPGPFFSITMASVCFINSFSAVLQGSLFGQLGTMPSTYSTLFLSGQ 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE4 GLAGFFASVAMICAIASGSELSESAFGYFITACAVIILTIICYLGLPRLEFYRYYQQLKL ::::.::..::. ..::: . ::.::::: :. :...:.:::.::.:.: ::: : CCDS73 GLAGIFAALAMLLSMASGVDAETSALGYFITPCVGILMSIVCYLSLPHLKFARYYLANKS 170 180 190 200 210 220 250 260 270 280 290 pF1KE4 EGPGEQE--TKLDLISKGEEPRAGKEESGVSVSNSQPTNESHSIKAILKNISVLAFSVCF :: :: .:. CCDS73 SQAQAQELETKAELLQSDLADSAVPCVGLHSHPVRLPRHHSHGDQLHQSWEVESVLQPHL 230 240 250 260 270 280 >>CCDS5340.1 SLC29A4 gene_id:222962|Hs108|chr7 (530 aa) initn: 340 init1: 114 opt: 263 Z-score: 331.1 bits: 70.7 E(32554): 4e-12 Smith-Waterman score: 382; 24.9% identity (54.3% similar) in 486 aa overlap (7-450:63-503) 10 20 30 pF1KE4 MTTSHQPQDRYKAVWLIFFMLGLGTLLPWNFFMTAT :.:::.:... ... :.: :::.: :.: . CCDS53 LEEAAEAAQGQGLRARGVPAFTDTTLDEPVPDDRYHAIYFAMLLAGVGFLLPYNSFITDV 40 50 60 70 80 90 40 50 60 70 80 90 pF1KE4 QYFTNRLDMSQNVSLVTAELSKDAQASAAPAAPLPERNSLSAIFNNVMTLCAMLPLLLFT .:. .. :.. : .:. :.: .: : . CCDS53 DYLHHKY----------------------PGT--------SIVFD--MSLTYILVALAAV 100 110 120 100 110 120 130 140 150 pF1KE4 YLNSFLHQRIPQSVRIL-GSLVAILLVFLITAILVKVQL-DALPFFVITMIKIVLINSFG ::. : .:. .:: : :.:. ...:. : .:: . ..:.. . . .:: CCDS53 LLNNVLVERLTLHTRITAGYLLALGPLLFISICDVWLQLFSRDQAYAINLAAVGTV-AFG 130 140 150 160 170 160 170 180 190 200 210 pF1KE4 -AILQGSLFGLAGLLPASYTAPIMSGQGLAGFFASVAMICAIASGSELSESAFGYFITAC .. :.:..: .:.:: :: .:.:.. :: . :.. : . . :.. .:... CCDS53 CTVQQSSFYGYTGMLPKRYTQGVMTGESTAGVMISLSRILTKLLLPDERASTLIFFLVSV 180 190 200 210 220 230 220 230 240 250 pF1KE4 AVIILTIICYLGLPRLEFYRYYQQLKLEG----PGE-----QETKLDLISKG---EEP-- :. .: .. .: . : .: .: .. :: ... :... :.: CCDS53 ALELLCFLLHLLVRRSRFVLFYTTRPRDSHRGRPGLGRGYGYRVHHDVVAGDVHFEHPAP 240 250 260 270 280 290 260 270 280 290 pF1KE4 -----RAGKEESGVSVSNS----------QPTNESH--SIKAILKNISVLA-------FS .. :. . :..: .: . ...:.: . :.: .: CCDS53 ALAPNESPKDSPAHEVTGSGGAYMRFDVPRPRVQRSWPTFRALLLHRYVVARVIWADMLS 300 310 320 330 340 350 300 310 320 330 340 350 pF1KE4 VCFIFTITIGMFPAVTVEVKSSIAGSSTWERYFIPVSCFLTFNIFDWLGRSLTAVFM-WP . . ::. .::.. :.. : : : .:. . .::. :..:. :.:. . : CCDS53 IAVTYFITLCLFPGLESEIRHCILG--EW----LPILIMAVFNLSDFVGKILAALPVDWR 360 370 380 390 400 410 360 370 380 390 400 410 pF1KE4 GKDSRWLPSLVLARLVFVPLLLLCNIKPRRYLTVVFEHDAWFIFFMAAFAFSNGYLASLC : .. : : :.::.::..:: . : . ...: :: .: ...::::..:. CCDS53 G--THLLACSCL-RVVFIPLFILC-VYPSGM--PALRHPAWPCIFSLLMGISNGYFGSVP 420 430 440 450 460 420 430 440 450 pF1KE4 MCFGPKKVKPAEAETAGAIMAFFLCLGLALGAVFSFLFRAIV : .. ::.: . : :: :. ::.::.. .. CCDS53 MILAAGKVSPKQRELAGNTMTVSYMSGLTLGSAVAYCTYSLTRDAHGSCLHASTANGSIL 470 480 490 500 510 520 CCDS53 AGL 530 456 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:38:31 2016 done: Sun Nov 6 00:38:32 2016 Total Scan time: 3.060 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]