FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4455, 475 aa 1>>>pF1KE4455 475 - 475 aa - 475 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.1112+/-0.00105; mu= 18.3589+/- 0.063 mean_var=59.8359+/-12.327, 0's: 0 Z-trim(103.5): 26 B-trim: 481 in 1/45 Lambda= 0.165803 statistics sampled from 7447 (7455) to 7447 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.588), E-opt: 0.2 (0.229), width: 16 Scan time: 2.090 The best scores are: opt bits E(32554) CCDS8200.1 DHCR7 gene_id:1717|Hs108|chr11 ( 475) 3371 815.2 0 CCDS41669.1 TM7SF2 gene_id:7108|Hs108|chr11 ( 418) 546 139.4 7.1e-33 CCDS1545.1 LBR gene_id:3930|Hs108|chr1 ( 615) 425 110.5 5.1e-24 CCDS60846.1 TM7SF2 gene_id:7108|Hs108|chr11 ( 391) 349 92.3 1e-18 >>CCDS8200.1 DHCR7 gene_id:1717|Hs108|chr11 (475 aa) initn: 3371 init1: 3371 opt: 3371 Z-score: 4354.9 bits: 815.2 E(32554): 0 Smith-Waterman score: 3371; 100.0% identity (100.0% similar) in 475 aa overlap (1-475:1-475) 10 20 30 40 50 60 pF1KE4 MAAKSQPNIPKAKSLDGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFAPFIVYYFIMA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 MAAKSQPNIPKAKSLDGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFAPFIVYYFIMA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 CDQYSCALTGPVVDIVTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCHK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 CDQYSCALTGPVVDIVTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCHK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 FLPGYVGGIQEGAVTPAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIPL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 FLPGYVGGIQEGAVTPAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIPL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 LWCANILGYAVSTFAMVKGYFFPTSARDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFFN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 LWCANILGYAVSTFAMVKGYFFPTSARDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFFN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 GRPGIVAWTLINLSFAAKQRELHSHVTNAMVLVNVLQAIYVIDFFWNETWYLKTIDICHD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 GRPGIVAWTLINLSFAAKQRELHSHVTNAMVLVNVLQAIYVIDFFWNETWYLKTIDICHD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 HFGWYLGWGDCVWLPYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQKDL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 HFGWYLGWGDCVWLPYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQKDL 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 FRRTDGRCLIWGRKPKVIECSYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSLAYCL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 FRRTDGRCLIWGRKPKVIECSYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSLAYCL 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 ACGGGHLLPYFYIIYMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 ACGGGHLLPYFYIIYMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF 430 440 450 460 470 >>CCDS41669.1 TM7SF2 gene_id:7108|Hs108|chr11 (418 aa) initn: 864 init1: 427 opt: 546 Z-score: 703.7 bits: 139.4 E(32554): 7.1e-33 Smith-Waterman score: 901; 37.6% identity (63.8% similar) in 431 aa overlap (46-475:22-418) 20 30 40 50 60 70 pF1KE4 DGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFAPFIVYYFIMACDQYSCALTGPVVDI :::. : ......: . : :: ... CCDS41 MAPTQGPRAPLEFGGPLGAAALLLLLPATMFHLLLAARSGPARLLGPPASL 10 20 30 40 50 80 90 100 110 120 130 pF1KE4 VTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCHKFLPGYVGGIQEGAVT : : .: .: .: :. :. .:. :: .::. . :: CCDS41 -PG---LEVLW--SP----RALLLWLAWLGLQAALY---------LLPAR--KVAEGQEL 60 70 80 90 140 150 160 170 180 190 pF1KE4 PAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIPLLWCANILGYAVSTFA .: :::.:: .:: :: .. . . . . . .:: . :.. .. : : CCDS41 KDKSRLRYPINGFQALVLTALL--VGLGMSAGLPLGALPEMLLPLAFVATLTAFIFSLFL 100 110 120 130 140 200 210 220 230 240 250 pF1KE4 MVKGYFFPTSA-RDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFFNGRPGIVAWTLINLS ..:. :.:: .:: .:....: :.:::: .:::: : . :::...:.::::. CCDS41 YMKAQVAPVSALAPGGNSGNPIYDFFLGRELNPRIC-FFDFKYFCELRPGLIGWVLINLA 150 160 170 180 190 200 260 270 280 290 300 310 pF1KE4 FAAKQRELHSHVTNAMVLVNVLQAIYVIDFFWNETWYLKTIDICHDHFGWYLGWGDCVWL . :. ::.. . :: ::: .: .:: : .:.: : :.:: :: ::..:..:: .:. CCDS41 LLMKEAELRGSPSLAMWLVNGFQLLYVGDALWHEEAVLTTMDITHDGFGFMLAFGDMAWV 210 220 230 240 250 260 320 330 340 350 360 370 pF1KE4 PYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQKDLFRRTDGRCLIWGRK :. :.::. .:..:: :. : : . :.. .:::::: :: ::. ::.. . . : . CCDS41 PFTYSLQAQFLLHHPQPLGLPMASVICLINATGYYIFRGANSQKNTFRKNPSDPRVAGLE 270 280 290 300 310 320 380 390 400 410 420 430 pF1KE4 PKVIECSYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSLAYCLACGGGHLLPYFYII . ..: :. ::::::.::..:: ::.:::. .::. : :: .:::::::.. CCDS41 ------TISTATGR----KLLVSGWWGMVRHPNYLGDLIMALAWSLPCGVSHLLPYFYLL 330 340 350 360 370 440 450 460 470 pF1KE4 YMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF :.. ::.:: :::..: .::: :..: ::::..: :. CCDS41 YFTALLVHREARDERQCLQKYGLAWQEYCRRVPYRIMPYIY 380 390 400 410 >>CCDS1545.1 LBR gene_id:3930|Hs108|chr1 (615 aa) initn: 881 init1: 355 opt: 425 Z-score: 544.8 bits: 110.5 E(32554): 5.1e-24 Smith-Waterman score: 911; 35.0% identity (65.0% similar) in 449 aa overlap (31-475:203-615) 10 20 30 40 50 pF1KE4 MAAKSQPNIPKAKSLDGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFA-PFIVYYFIM :: ... :. . .::..:. : ... ... CCDS15 EEVKLKEIDSKEEKYVAKELAVRTFEVTPIRAKDLE-FGGVPGVFLIMFGLPVFLFLLLL 180 190 200 210 220 230 60 70 80 90 100 110 pF1KE4 ACDQYSCALTGPVVDIVTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCH : : . .: ... : ..: .. .: :: .:::.: CCDS15 MCKQKDPSL----LNFPPPLPALYELWET------RVFGVYLLWFLIQVLFY-------- 240 250 260 270 120 130 140 150 160 170 pF1KE4 KFLPGYVGGIQEGAVTPAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIP .:: .: . ::. : ::..::. :..:: . .. :.. ...... CCDS15 -LLP--IGKVVEGTPLIDGRRLKYRLNGFYAFILTSAV--IGTSLFQGVEFHYVYSHFLQ 280 290 300 310 320 180 190 200 210 220 230 pF1KE4 LLWCANILGYAVSTFAMVKGYFFPTSARDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFF . :... ..:.. .... : . . .:: :....: :.::::: ::.: : CCDS15 FALAATVFCVVLSVYLYMRSLKAPRNDLSPASSGNAVYDFFIGRELNPRIGT-FDLKYFC 330 340 350 360 370 380 240 250 260 270 280 290 pF1KE4 NGRPGIVAWTLINLSFAAKQRELHSHVTN--AMVLVNVLQAIYVIDFFWNETWYLKTIDI . :::...:..::: . . ....... ::.::: .: .::.: .::: : :.:: CCDS15 ELRPGLIGWVVINLVMLLAEMKIQDRAVPSLAMILVNSFQLLYVVDALWNEEALLTTMDI 390 400 410 420 430 440 300 310 320 330 340 350 pF1KE4 CHDHFGWYLGWGDCVWLPYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQ :: ::..:..:: ::.:..:..:..::: :: ..: : : ...: : :: ::: :: : CCDS15 IHDGFGFMLAFGDLVWVPFIYSFQAFYLVSHPNEVSWPMASLIIVLKLCGYVIFRGANSQ 450 460 470 480 490 500 360 370 380 390 400 410 pF1KE4 KDLFRRTDGRCLIWGRKPKVIEC-SYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSL :. ::.. . ::. . . .. :. .:::::.:: .:: ::.:::. .: CCDS15 KNAFRKNPS-------DPKLAHLKTIHTSTGK----NLLVSGWWGFVRHPNYLGDLIMAL 510 520 530 540 550 420 430 440 450 460 470 pF1KE4 AYCLACGGGHLLPYFYIIYMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF :. : :: .:.::::::::...::.:: :::..: .::: ::.: ::::..: :. CCDS15 AWSLPCGFNHILPYFYIIYFTMLLVHREARDEYHCKKKYGVAWEKYCQRVPYRIFPYIY 560 570 580 590 600 610 >>CCDS60846.1 TM7SF2 gene_id:7108|Hs108|chr11 (391 aa) initn: 783 init1: 349 opt: 349 Z-score: 449.5 bits: 92.3 E(32554): 1e-18 Smith-Waterman score: 779; 35.3% identity (59.6% similar) in 431 aa overlap (46-475:22-391) 20 30 40 50 60 70 pF1KE4 DGVTNDRTASQGQWGRAWEVDWFSLASVIFLLLFAPFIVYYFIMACDQYSCALTGPVVDI :::. : ......: . : :: ... CCDS60 MAPTQGPRAPLEFGGPLGAAALLLLLPATMFHLLLAARSGPARLLGPPASL 10 20 30 40 50 80 90 100 110 120 130 pF1KE4 VTGHARLSDIWAKTPPITRKAAQLYTLWVTFQVLLYTSLPDFCHKFLPGYVGGIQEGAVT : : .: .: .: :. :. .:. :: .::. . :: CCDS60 -PG---LEVLW--SP----RALLLWLAWLGLQAALY---------LLPAR--KVAEGQEL 60 70 80 90 140 150 160 170 180 190 pF1KE4 PAGVVNKYQINGLQAWLLTHLLWFANAHLLSWFSPTIIFDNWIPLLWCANILGYAVSTFA .: :::.:: .:: :: .. . . . . . .:: . :.. .. : : CCDS60 KDKSRLRYPINGFQALVLTALL--VGLGMSAGLPLGALPEMLLPLAFVATLTAFIFSLFL 100 110 120 130 140 200 210 220 230 240 250 pF1KE4 MVKGYFFPTSA-RDCKFTGNFFYNYMMGIEFNPRIGKWFDFKLFFNGRPGIVAWTLINLS ..:. :.:: .:: .:....: :.:::: .:::: : . :::...:.::::. CCDS60 YMKAQVAPVSALAPGGNSGNPIYDFFLGRELNPRIC-FFDFKYFCELRPGLIGWVLINLA 150 160 170 180 190 200 260 270 280 290 300 310 pF1KE4 FAAKQRELHSHVTNAMVLVNVLQAIYVIDFFWNETWYLKTIDICHDHFGWYLGWGDCVWL . :. ::.. . :: ::: .: .:: : .:.: : :.:: :: ::..:..:: .:. CCDS60 LLMKEAELRGSPSLAMWLVNGFQLLYVGDALWHEEAVLTTMDITHDGFGFMLAFGDMAWV 210 220 230 240 250 260 320 330 340 350 360 370 pF1KE4 PYLYTLQGLYLVYHPVQLSTPHAVGVLLLGLVGYYIFRVANHQKDLFRRTDGRCLIWGRK :. :.::. .:..:: :. : : . ::: : . CCDS60 PFTYSLQAQFLLHHPQPLGLPMASVI---------------------------CLINGLE 270 280 290 300 380 390 400 410 420 430 pF1KE4 PKVIECSYTSADGQRHHSKLLVSGFWGVARHFNYVGDLMGSLAYCLACGGGHLLPYFYII . ..: :. ::::::.::..:: ::.:::. .::. : :: .:::::::.. CCDS60 ------TISTATGR----KLLVSGWWGMVRHPNYLGDLIMALAWSLPCGVSHLLPYFYLL 310 320 330 340 350 440 450 460 470 pF1KE4 YMAILLTHRCLRDEHRCASKYGRDWERYTAAVPYRLLPGIF :.. ::.:: :::..: .::: :..: ::::..: :. CCDS60 YFTALLVHREARDERQCLQKYGLAWQEYCRRVPYRIMPYIY 360 370 380 390 475 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:00:30 2016 done: Sun Nov 6 01:00:31 2016 Total Scan time: 2.090 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]