FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6646, 226 aa 1>>>pF1KE6646 226 - 226 aa - 226 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.3279+/-0.000982; mu= 3.5412+/- 0.058 mean_var=170.7225+/-36.104, 0's: 0 Z-trim(109.5): 131 B-trim: 2 in 1/53 Lambda= 0.098159 statistics sampled from 10748 (10901) to 10748 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.714), E-opt: 0.2 (0.335), width: 16 Scan time: 1.670 The best scores are: opt bits E(32554) CCDS661.1 NEGR1 gene_id:257194|Hs108|chr1 ( 354) 1507 225.5 3.4e-59 CCDS2982.1 LSAMP gene_id:4045|Hs108|chr3 ( 338) 768 120.8 1e-27 CCDS8491.1 NTM gene_id:50863|Hs108|chr11 ( 344) 706 112.1 4.6e-25 CCDS41733.1 NTM gene_id:50863|Hs108|chr11 ( 344) 706 112.1 4.6e-25 CCDS81649.1 OPCML gene_id:4978|Hs108|chr11 ( 304) 696 110.6 1.1e-24 CCDS31722.1 OPCML gene_id:4978|Hs108|chr11 ( 338) 696 110.7 1.2e-24 CCDS8492.1 OPCML gene_id:4978|Hs108|chr11 ( 345) 696 110.7 1.2e-24 CCDS44778.1 NTM gene_id:50863|Hs108|chr11 ( 316) 692 110.1 1.7e-24 CCDS44777.1 NTM gene_id:50863|Hs108|chr11 ( 355) 692 110.1 1.9e-24 CCDS46158.1 IGLON5 gene_id:402665|Hs108|chr19 ( 336) 594 96.2 2.7e-20 >>CCDS661.1 NEGR1 gene_id:257194|Hs108|chr1 (354 aa) initn: 1507 init1: 1507 opt: 1507 Z-score: 1176.3 bits: 225.5 E(32554): 3.4e-59 Smith-Waterman score: 1507; 100.0% identity (100.0% similar) in 226 aa overlap (1-226:129-354) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTL :::::::::::::::::::::::::::::: CCDS66 RDYSLQIQNVDVTDDGPYTCSVQTQHTPRTMQVHLTVQVPPKIYDISNDMTVNEGTNVTL 100 110 120 130 140 150 40 50 60 70 80 90 pF1KE6 TCLATGKPEPSISWRHISPSAKPFENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKVK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 TCLATGKPEPSISWRHISPSAKPFENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKVK 160 170 180 190 200 210 100 110 120 130 140 150 pF1KE6 VVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 VVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFST 220 230 240 250 260 270 160 170 180 190 200 210 pF1KE6 RSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS66 RSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVLT 280 290 300 310 320 330 220 pF1KE6 LSSFTSIFYLKNAILQ :::::::::::::::: CCDS66 LSSFTSIFYLKNAILQ 340 350 >>CCDS2982.1 LSAMP gene_id:4045|Hs108|chr3 (338 aa) initn: 675 init1: 359 opt: 768 Z-score: 610.9 bits: 120.8 E(32554): 1e-27 Smith-Waterman score: 768; 53.7% identity (81.0% similar) in 216 aa overlap (2-216:123-336) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT ::.: ::::::: .::.:.:::::.::::. CCDS29 EYSLRIQKVDVYDEGSYTCSVQTQHEPKTSQVYLIVQVPPKISNISSDVTVNEGSNVTLV 100 110 120 130 140 150 40 50 60 70 80 90 pF1KE6 CLATGKPEPSISWRHISPSAKPFENGQ-YLDIYGITRDQAGEYECSAENDVSFPDVRKVK :.:.:.::: :.:::..:... ::. . ::.: ::::.:.:.:::.: :.:: ::..:: CCDS29 CMANGRPEPVITWRHLTPTGREFEGEEEYLEILGITREQSGKYECKAANEVSSADVKQVK 160 170 180 190 200 210 100 110 120 130 140 150 pF1KE6 VVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFST :.::. ::: : ::. .: ::.. ..::...:: : ::::. . .. :. .:. :.. CCDS29 VTVNYPPTITESKSNEATTGRQASLKCEASAVPAPDFEWYRDDTRI-NSANGLEIKSTEG 220 230 240 250 260 270 160 170 180 190 200 210 pF1KE6 RSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVLT .: :::::::.::.::::::::::::.::::: : :.... ::.:: .. : :. . CCDS29 QSSLTVTNVTEEHYGNYTCVAANKLGVTNASLVLFRPGSVR-GINGSISLAVPLWLLAAS 280 290 300 310 320 330 220 pF1KE6 LSSFTSIFYLKNAILQ : . : CCDS29 LLCLLSKC >>CCDS8491.1 NTM gene_id:50863|Hs108|chr11 (344 aa) initn: 690 init1: 445 opt: 706 Z-score: 563.4 bits: 112.1 E(32554): 4.6e-25 Smith-Waterman score: 706; 49.3% identity (76.6% similar) in 209 aa overlap (2-209:127-335) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT .::: ::: ::: .::.:...:::.:..:: CCDS84 QYSIEIQNVDVYDEGPYTCSVQTDNHPKTSRVHLIVQVSPKIVEISSDISINEGNNISLT 100 110 120 130 140 150 40 50 60 70 80 90 pF1KE6 CLATGKPEPSISWRHISPSAKPF-ENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKVK :.:::.:::...::::::.: : . .::.: ::::.:.:.::::: :::. : ::.:: CCDS84 CIATGRPEPTVTWRHISPKAVGFVSEDEYLEIQGITREQSGDYECSASNDVAAPVVRRVK 160 170 180 190 200 210 100 110 120 130 140 150 pF1KE6 VVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFST :.::. : :.: :. : :..: ..::...:: :.::: .:.:..:..:. ..: CCDS84 VTVNYPPYISEAKGTGVPVGQKGTLQCEASAVPSAEFQWYKDDKRLIEGKKGVKVENRPF 220 230 240 250 260 270 160 170 180 190 200 210 pF1KE6 RSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVLT : : ::... .:::::::.:::: ::::. : :.... .:.. : : : CCDS84 LSKLIFFNVSEHDYGNYTCVASNKLGHTNASIMLFGPGAVSEVSNGTSRRAGCVWLLPLL 280 290 300 310 320 330 220 pF1KE6 LSSFTSIFYLKNAILQ CCDS84 VLHLLLKF 340 >>CCDS41733.1 NTM gene_id:50863|Hs108|chr11 (344 aa) initn: 690 init1: 445 opt: 706 Z-score: 563.4 bits: 112.1 E(32554): 4.6e-25 Smith-Waterman score: 706; 49.3% identity (76.6% similar) in 209 aa overlap (2-209:127-335) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT .::: ::: ::: .::.:...:::.:..:: CCDS41 QYSIEIQNVDVYDEGPYTCSVQTDNHPKTSRVHLIVQVSPKIVEISSDISINEGNNISLT 100 110 120 130 140 150 40 50 60 70 80 90 pF1KE6 CLATGKPEPSISWRHISPSAKPF-ENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKVK :.:::.:::...::::::.: : . .::.: ::::.:.:.::::: :::. : ::.:: CCDS41 CIATGRPEPTVTWRHISPKAVGFVSEDEYLEIQGITREQSGDYECSASNDVAAPVVRRVK 160 170 180 190 200 210 100 110 120 130 140 150 pF1KE6 VVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFST :.::. : :.: :. : :..: ..::...:: :.::: .:.:..:..:. ..: CCDS41 VTVNYPPYISEAKGTGVPVGQKGTLQCEASAVPSAEFQWYKDDKRLIEGKKGVKVENRPF 220 230 240 250 260 270 160 170 180 190 200 210 pF1KE6 RSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVLT : : ::... .:::::::.:::: ::::. : :.... .:.. : : : CCDS41 LSKLIFFNVSEHDYGNYTCVASNKLGHTNASIMLFGPGAVSEVSNGTSRRAGCVWLLPLL 280 290 300 310 320 330 220 pF1KE6 LSSFTSIFYLKNAILQ CCDS41 VLHLLLKF 340 >>CCDS81649.1 OPCML gene_id:4978|Hs108|chr11 (304 aa) initn: 694 init1: 449 opt: 696 Z-score: 556.4 bits: 110.6 E(32554): 1.1e-24 Smith-Waterman score: 696; 48.6% identity (76.1% similar) in 222 aa overlap (2-221:86-303) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT .::: :::::.:..::.:.:::::..::: CCDS81 QYSIMIQNVDVYDEGPYTCSVQTDNHPKTSRVHLIVQVPPQIMNISSDITVNEGSSVTLL 60 70 80 90 100 110 40 50 60 70 80 pF1KE6 CLATGKPEPSISWRHIS-PSAKPF-ENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKV ::: :.:::...:::.: .. : . .::.: : :::.::::::: :::. :::::: CCDS81 CLAIGRPEPTVTWRHLSVKEGQGFVSEDEYLEISDIKRDQSGEYECSALNDVAAPDVRKV 120 130 140 150 160 170 90 100 110 120 130 140 pF1KE6 KVVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFS :..::. : :.. :. :. :..:.. ::...:: :.:.: : .: .: .:. :.: . CCDS81 KITVNYPPYISKAKNTGVSVGQKGILSCEASAVPMAEFQWFKEETRLATGLDGMRIENKG 180 190 200 210 220 230 150 160 170 180 190 200 pF1KE6 TRSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVL : :: ::... .:::::::.::::.::::. : :... :.. ::. ..: .: CCDS81 RMSTLTFFNVSEKDYGNYTCVATNKLGNTNASITLYGPGAVIDGVN-SASRALACLWLSG 240 250 260 270 280 290 210 220 pF1KE6 TLSSFTSIFYLKNAILQ :: . :..: CCDS81 TLLAH---FFIKF 300 >>CCDS31722.1 OPCML gene_id:4978|Hs108|chr11 (338 aa) initn: 694 init1: 449 opt: 696 Z-score: 555.8 bits: 110.7 E(32554): 1.2e-24 Smith-Waterman score: 696; 48.6% identity (76.1% similar) in 222 aa overlap (2-221:120-337) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT .::: :::::.:..::.:.:::::..::: CCDS31 QYSIMIQNVDVYDEGPYTCSVQTDNHPKTSRVHLIVQVPPQIMNISSDITVNEGSSVTLL 90 100 110 120 130 140 40 50 60 70 80 pF1KE6 CLATGKPEPSISWRHIS-PSAKPF-ENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKV ::: :.:::...:::.: .. : . .::.: : :::.::::::: :::. :::::: CCDS31 CLAIGRPEPTVTWRHLSVKEGQGFVSEDEYLEISDIKRDQSGEYECSALNDVAAPDVRKV 150 160 170 180 190 200 90 100 110 120 130 140 pF1KE6 KVVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFS :..::. : :.. :. :. :..:.. ::...:: :.:.: : .: .: .:. :.: . CCDS31 KITVNYPPYISKAKNTGVSVGQKGILSCEASAVPMAEFQWFKEETRLATGLDGMRIENKG 210 220 230 240 250 260 150 160 170 180 190 200 pF1KE6 TRSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVL : :: ::... .:::::::.::::.::::. : :... :.. ::. ..: .: CCDS31 RMSTLTFFNVSEKDYGNYTCVATNKLGNTNASITLYGPGAVIDGVN-SASRALACLWLSG 270 280 290 300 310 320 210 220 pF1KE6 TLSSFTSIFYLKNAILQ :: . :..: CCDS31 TLLAH---FFIKF 330 >>CCDS8492.1 OPCML gene_id:4978|Hs108|chr11 (345 aa) initn: 694 init1: 449 opt: 696 Z-score: 555.7 bits: 110.7 E(32554): 1.2e-24 Smith-Waterman score: 696; 48.6% identity (76.1% similar) in 222 aa overlap (2-221:127-344) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT .::: :::::.:..::.:.:::::..::: CCDS84 QYSIMIQNVDVYDEGPYTCSVQTDNHPKTSRVHLIVQVPPQIMNISSDITVNEGSSVTLL 100 110 120 130 140 150 40 50 60 70 80 pF1KE6 CLATGKPEPSISWRHIS-PSAKPF-ENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKV ::: :.:::...:::.: .. : . .::.: : :::.::::::: :::. :::::: CCDS84 CLAIGRPEPTVTWRHLSVKEGQGFVSEDEYLEISDIKRDQSGEYECSALNDVAAPDVRKV 160 170 180 190 200 210 90 100 110 120 130 140 pF1KE6 KVVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFS :..::. : :.. :. :. :..:.. ::...:: :.:.: : .: .: .:. :.: . CCDS84 KITVNYPPYISKAKNTGVSVGQKGILSCEASAVPMAEFQWFKEETRLATGLDGMRIENKG 220 230 240 250 260 270 150 160 170 180 190 200 pF1KE6 TRSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVL : :: ::... .:::::::.::::.::::. : :... :.. ::. ..: .: CCDS84 RMSTLTFFNVSEKDYGNYTCVATNKLGNTNASITLYGPGAVIDGVN-SASRALACLWLSG 280 290 300 310 320 330 210 220 pF1KE6 TLSSFTSIFYLKNAILQ :: . :..: CCDS84 TLLAH---FFIKF 340 >>CCDS44778.1 NTM gene_id:50863|Hs108|chr11 (316 aa) initn: 690 init1: 445 opt: 692 Z-score: 553.2 bits: 110.1 E(32554): 1.7e-24 Smith-Waterman score: 692; 53.3% identity (80.4% similar) in 184 aa overlap (2-184:127-310) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT .::: ::: ::: .::.:...:::.:..:: CCDS44 QYSIEIQNVDVYDEGPYTCSVQTDNHPKTSRVHLIVQVSPKIVEISSDISINEGNNISLT 100 110 120 130 140 150 40 50 60 70 80 90 pF1KE6 CLATGKPEPSISWRHISPSAKPF-ENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKVK :.:::.:::...::::::.: : . .::.: ::::.:.:.::::: :::. : ::.:: CCDS44 CIATGRPEPTVTWRHISPKAVGFVSEDEYLEIQGITREQSGDYECSASNDVAAPVVRRVK 160 170 180 190 200 210 100 110 120 130 140 150 pF1KE6 VVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFST :.::. : :.: :. : :..: ..::...:: :.::: .:.:..:..:. ..: CCDS44 VTVNYPPYISEAKGTGVPVGQKGTLQCEASAVPSAEFQWYKDDKRLIEGKKGVKVENRPF 220 230 240 250 260 270 160 170 180 190 200 210 pF1KE6 RSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVLT : : ::... .:::::::.:::: ::::. : CCDS44 LSKLIFFNVSEHDYGNYTCVASNKLGHTNASIMLFGETVL 280 290 300 310 220 pF1KE6 LSSFTSIFYLKNAILQ >>CCDS44777.1 NTM gene_id:50863|Hs108|chr11 (355 aa) initn: 690 init1: 445 opt: 692 Z-score: 552.5 bits: 110.1 E(32554): 1.9e-24 Smith-Waterman score: 692; 53.3% identity (80.4% similar) in 184 aa overlap (2-184:127-310) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT .::: ::: ::: .::.:...:::.:..:: CCDS44 QYSIEIQNVDVYDEGPYTCSVQTDNHPKTSRVHLIVQVSPKIVEISSDISINEGNNISLT 100 110 120 130 140 150 40 50 60 70 80 90 pF1KE6 CLATGKPEPSISWRHISPSAKPF-ENGQYLDIYGITRDQAGEYECSAENDVSFPDVRKVK :.:::.:::...::::::.: : . .::.: ::::.:.:.::::: :::. : ::.:: CCDS44 CIATGRPEPTVTWRHISPKAVGFVSEDEYLEIQGITREQSGDYECSASNDVAAPVVRRVK 160 170 180 190 200 210 100 110 120 130 140 150 pF1KE6 VVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQQGIIIQNFST :.::. : :.: :. : :..: ..::...:: :.::: .:.:..:..:. ..: CCDS44 VTVNYPPYISEAKGTGVPVGQKGTLQCEASAVPSAEFQWYKDDKRLIEGKKGVKVENRPF 220 230 240 250 260 270 160 170 180 190 200 210 pF1KE6 RSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVLT : : ::... .:::::::.:::: ::::. : CCDS44 LSKLIFFNVSEHDYGNYTCVASNKLGHTNASIMLFEVKTTALTPWKGPGAVSEVSNGTSR 280 290 300 310 320 330 220 pF1KE6 LSSFTSIFYLKNAILQ CCDS44 RAGCVWLLPLLVLHLLLKF 340 350 >>CCDS46158.1 IGLON5 gene_id:402665|Hs108|chr19 (336 aa) initn: 542 init1: 246 opt: 594 Z-score: 477.8 bits: 96.2 E(32554): 2.7e-20 Smith-Waterman score: 594; 47.4% identity (75.3% similar) in 190 aa overlap (2-189:124-311) 10 20 30 pF1KE6 MQVHLTVQVPPKIYDISNDMTVNEGTNVTLT ::.: :.:: .: .::. .::::: ::.: CCDS46 EFSILITEVGLGDEGLYTCSFQTRHQPYTTQVYLIVHVPARIVNISSPVTVNEGGNVNLL 100 110 120 130 140 150 40 50 60 70 80 90 pF1KE6 CLATGKPEPSISWRHISPSAKPFENGQYLDIYGITRDQAGEYECSAENDV-SFPDVRKVK :::.:.:::...::.. . .:. :.: : : ::::::: ..: : : :: :.: CCDS46 CLAVGRPEPTVTWRQLRDGFTS--EGEILEISDIQRGQAGEYECVTHNGVNSAPDSRRVL 160 170 180 190 200 210 100 110 120 130 140 pF1KE6 VVVNFAPTIQEIKSGTVTPGRSGLIRCEGAGVPPPAFEWYKGEKKLFNGQ-QGIIIQNFS :.::. ::: .. :. .. ::..:.:::. .::: :.::: .. : .: .:. .:. CCDS46 VTVNYPPTITDVTSARTALGRAALLRCEAMAVPPADFQWYKDDRLLSSGTAEGLKVQTER 220 230 240 250 260 270 150 160 170 180 190 200 pF1KE6 TRSILTVTNVTQEHFGNYTCVAANKLGTTNASLPLNPPSTAQYGITGSADVLFSCWYLVL :::.: .::. .:.::::: :::.::...::. : :.. CCDS46 TRSMLLFANVSARHYGNYTCRAANRLGASSASMRLLRPGSLENSAPRPPGLLALLSALGW 280 290 300 310 320 330 210 220 pF1KE6 TLSSFTSIFYLKNAILQ CCDS46 LWWRM 226 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 15:04:55 2016 done: Tue Nov 8 15:04:56 2016 Total Scan time: 1.670 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]